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概念 

。 Unix 系统 包含 用 户 程 序 和 系统 内 核 

*。 内 核 由 多 个 子 系统 构成 

。 内核 管理 所 有 的 程序 和 资源 

， 进程 之 间 的 通信 对 Unix 程序 是 很 重要 的 
”什么 是 系统 编程 

相关 命令 

¢ bc 


^ more 


1.1 介 绍 


什么 是 系统 编程 ”什么 是 Unix RAHE? 本 书 具 体会 涉及 哪些 知识 ? 本 章 力 图 回答 
上 述 问题 。 

首先 从 分 析 操 作 系 统 的 职责 入 手 . 来 解释 如 何 编 写 与 操作 系统 紧密 相关 的 程序 。 然 后 
3X xd p AT Pe ES) Unix 命令 ,以 及 它们 用 到 的 系统 调用 ,进一步 指导 读者 自己 编程 实现 相应 
的 功能 。 这 一 章 的 最 后 会 通过 一 幅 图 来 描述 Unix 系统 。 本 书 的 主要 学 习 形 式 就 是 通过 图 
示 和 齐 析 文中 程序 所 涉及 的 命令 .技术 ,进而 实现 系统 编程 


1.2 什么 是 系统 编程 


1.2.1 简单 的 程序 模型 
你 可 能 写 过 各 种 各 样 的 程序 ,有 科学 计算 方面 的 .金融 方面 的 .图像 方面 的 .文字 处 理 方 
面 的 等 。 大 部 分 的 程序 都 是 基于 以 下 模型 ,如 图 1. 1 所 示 。 


计算 机 E 






8] 1.1. 计算 机 中 的 程序 


I Unix/Linux 编程 实践 救 程 
在 这 个 模型 中 .程序 就 是 可 以 在 计算 机 上 运行 的 一 姻 代 码 ,程序 把 输入 数据 做 相应 处 理 
后 输出 。 例 如 用 户 在 键盘 上 办 人 数据 ,然后 在 屏幕 得 到 输出 。 程 序 可 能 对 磁盘 进行 操作 ,还 
可 能 会 用 到 打印 机 。， 
Wi LRRD BURG: 


]* copy from stdin to stdout */ 
maiat ) 
( 
int C; 
while( ( c = getcbar() ) |= EOF ) 
putchar(c) ; 
) 


这 段 代 码 对 应 图 }. 2 Sra REA, 


putchar ( ) 





P 1.2 程序 的 输 人 1 和 输出 


在 图 1.2 中 键 焉 和 显示 促 与 程序 直 撑 相连。 在 简单 的 个 人 计算 机 中 ,实际 情况 是 很 类 似 
的 ,键盘 和 显示 卡 直 接连 到 计算 机 的 主板 上 ,CPU 和 内 存 也 是 通过 播 榴 直 接连 在 主板 上 , 它 
们 通过 主板 上 的 印刷 线路 , 连 为 一 体 ， 如 果 能 够 打开 机 箱 :所 看 到 的 大 致 如 此 。 


1.2.2 系统 模型 
如 果 所 使 用 的 系统 是 一 个 多 用 户 系统 ,如 典型 的 Unix 系统 , 那 会 是 一 副 怎 样 的 情形 呢 ? 





La, i m 
|. 
i 


图 1.3 多 个 用 户 、 程 序 和 设备 
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刚才 的 简单 异型 已 经 不 适用 ,网 1.3 会 间接 近 一 些 。 

在 这 个 系统 中 有 多 个 用 户 同 时 运行 多 个 程序 ,可 能 需要 访问 多 个 设备 。 

虽然 桂 型 复 条 了 ,但 对 程序 而 膏 , 它 还 是 从 键盘 得 到 数据 ,将 结果 显示 在 显示 器 上 ,也 可 
以 对 磁盘 谈 写 ,这些 操作 都 设 有 和 任何 问题 , 它 使 用 的 还 是 简单 模型 ， 

接 下 来 考虑 一 种 更 为 复杂 的 情况 ,有 许多 键盘 /显示 器 ,它们 可 以 随意 地 连接 到 不 辣 的 
程序 ,随意 地 操作 它们 ,这 种 情况 如 图 1. 4 所 示 。 





图 1.4 终端 可 以 随意 地 连接 到 程序 
实际 上 ,在 计算 机 内 部 ,这 种 随意 的 连接 是 不 允许 的 ,必须 采用 一 种 机 制 进行 管理 ， 
1.2.3 操作 系统 的 职责 


计 竺 饥 用 操作 系统 来 管理 所 有 的 资源 ,并 将 不 同 的 设备 和 不 同 的 程序 连接 起 来 。 从 连 
接 的 角度 来 讲 , 操 作 系统 的 作用 就 像 主 板 上 的 印刷 线路 一 样 ， 
有 了 操作 系统 以 后 ,图 1.4 的 混乱 状态 就 可 以 得 到 改变 ,新 的 模型 如 图 1.5 所 示 。 


用 户 空间 





图 1.5 操作 系统 是 一 个 特殊 的 程序 


操作 系统 也 是 程序 ,与 普通 程序 一 样 .也 运行 在 内 存 中 ,同时 它 又 是 一 个 特殊 的 程序 LU 
能 把 普通 程序 与 其 他 程序 或 设备 连接 起 来 。 
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1.2.4 为 程序 提供 服务 


现在 的 问题 (系统 中 的 多 个 用 户 和 程序 是 如 何 连 捷 起 来 的 ) 和 大 致 的 解决 办 法 ( 道 过 一 
个 管理 程序 ) 已 经 很 清楚 了 , 接 下 来 看 具体 的 解决 方案 。 

首先 要 解释 一 些 术 语 , 内 存 空间 用 来 存放 程序 和 数据 .就 像 古雅 典 人 脱出 空间 来 放 衣 服 
一 样 , 所 有 的 程序 都 必须 在 内 存 空间 中 才能 运行 ,用 米 容 续 操 作 系统 的 内 存 空间 叫做 系统 空 
[8] ,容纳 应 用 程序 的 内 存 空间 叫做 用 户 空间 ， 

操作 系统 也 定 称 为 内 核 , 有 了 内 核 的 概念 后 ,再 来 看 计算 机 系统 的 连接 情况 .如 图 1.6 
PR . 





图 1,6 内 核 管理 计算 机 系统 的 连接 


注意 ,在 图 1.6 中 可 以 发 现 ,程序 要 访问 设备 (如 键盘 、 磁 大 和 打印 机 ) 必 须 通 过 内 核 , 所 
以 只 有 内 核 才 能 直接 管理 设备 。 

程序 如 果 要 从 键盘 得 到 数据 ,必须 向 内 核发 出 请 求 , 若 在 显示 器 上 显示 结果 ,也 要 通过 
内 核 ,程序 中 所 有 对 设备 的 操作 都 是 通过 内 核 进 行 的 。 

图 1.6 中 的 线 是 内 核 提 供 的 虚拟 连接 线 , 内 核 向 程序 提供 服务 以 便 程 序 能 够 访问 到 设备 。 

解释 了 这 些 内 容 后 ,再 来 看 什么 是 系统 编程 。 编写 普通 程序 时 可 以 认为 .程序 是 家 接连 
到 键盘 .显示 项 、 磁 盘 等 设备 的 ,但 在 进行 系统 编程 时 ,必须 对 系统 的 结构 和 工作 方式 有 更 深 
的 了 解 ,要 知道 内 核 提 供 哪 些 服 务 ( 系 统 调 用 ) ,如 何 使 用 它们 :系统 有 哪些 资源 和 设备 ,不同 
的 资源 和 设备 该 如 何 操作 。 


1.3 ”理解 系统 编程 


内 核 提 供 服务 以 便 系 统 程序 可 以 直接 访问 系统 资源 ,那么 有 哪些 系统 资源 和 服务 呢 ? 
13.1 系统 资源 


1、 处 理 回 (Processor) 
程序 是 由 指令 构成 的 ,处 理 器 是 执行 指令 的 硬件 设备 .一 个 系统 中 可 能 有 多 个 处 理 器 。 
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内 核能 够 安排 一 个 程序 何 时 并 始 执行 , 何 时 暂时 停止 .恢复 执行 , 何 时 终止 执行 。 

2. p EE I/O) 

程序 中 所 有 输入 /输出 的 数据 、 终 端的 输入 /输出 数据 还 有 硬盘 输入 /输出 数据 ,部 必须 
HAA Ge PRA RAL PRA: 正确 性 ,数据 流 不 会 流 错 地 方 : 有 效 性 ,程序 员 
无 需 考 虑 不 同 设备 之 问 的 差异 ; 安全 性 ,数据 信息 不 会 钙 未 被 授权 的 程序 非法 访问。 

3. 进程 管理 (Process Management) 

进程 指 程序 的 一 次 运行 ,每 个 进程 都 有 自己 的 资源 ,如 内 存 . 打 开 的 文件 和 其 他 运行 时 
Se RRA. ARP SRE KYRA ARETE .中 止 进程 .进程 调度 等 。 

4. Af Memory) 

内 存 是 计算 要 系统 中 很 重要 的 资源 ,程序 必须 被 装载 到 内 存 中 才 可 以 运行 。 内 核 的 职 
贡 之 一 是 内 存 管 理 , 在 需要 的 时 候 给 程序 分 外 内 存 , 当 程序 不 逢 要 的 时 想 回 收 内 存 ,; 内 核 还 
此 能 保证 内 三 不 锌 其 他 的 进程 非法 访问 。 

5. 144 (Device) 

计算 机 系统 中 可 以 有 各 种 各 样 的 外 设 , 如 磁带 机 SER is FR RRS. 
它们 的 操作 方式 各 不 相同 ,内 核能 屏蔽 掉 这 种 差异 ,使 得 对 设备 的 操作 方式 简单 面 统 一 。 例 
如 ,一 个 程序 想 要 从 数码 照相 机 中 取出 照片 存 鱼 在 计算 机 中 , 它 只 需 向 内 核 提 出 操作 该 资源 
的 请 求 即 可 。 

6. 计时 器 (Timers) 

程序 的 工作 与 时 间 有 关 , 有 的 需要 定时 被 触发 ,有 的 需要 等 一 段 时 间 再 开始 某 个 动作 ， 
“有 的 需要 知道 菜 一 个 操作 消耗 的 了 时间, 这 些 都 涉及 计时 器 ,内 核 可 以 通过 杀 统 调用 向 应 用 程 
FESR GE ipm SS ARF 

7, 讲 程 间 通 入 (Interproccss Communication) 

在 现实 生活 中 人 们 通过 电话 、e-mail, 信 人 忻 . 广 播 . 电 视 等 互相 通信 ,在 计算 机 的 世界 中 ， 
不 同 的 进程 也 需要 互相 通信 ,内 核 提供 的 服务 使 进程 同 通 信和 成 为 可 能 。 就 像 电 信和 和 邮政 提 
供 的 服务 ,通信 也 是 资源 ， 

8. RB] S (Networking) 

网 络 之 间 的 通信 可 以 看 作 是 进程 间 通 信 的 特殊 形式 ,通过 网 络 ,不 同 主机 上 的 进程 , 即 
使 使 用 的 是 不 同 操作 系统 ,也 可 以 互相 通信 。 网 络 通信 也 是 内 核 提 供 的 服务 。 





1.3.2 目标 : 理解 系统 编程 


刚才 已 经 商 单 介绍 了 内 核 所 提供 的 各 种 类 型 的 服务 ,各 种 内 撤 服 务 具 体育 什么 特点 ,会 
用 到 哪些 届 备 ,需要 哪些 参数 ,会 提供 哪些 数据 , 接 下 来 的 目标 是 掌握 内 核 服 务 的 机 制 ,以 便 
在 具 己 的 程序 中 使 用 这 些 服务 。 


1.3.3 方法 : 通过 三 个 问题 来 理解 
本 书 遂 过 以 下 3 个 步骤 来 学 习 。， 
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1, 分 析 程 序 

首先 分 析 现 有 的 程序 ,了 解 它 的 功能 及 实现 原理 ， 

Z. 学 习 系 统 调 用 

看 程序 都 用 到 哪些 系统 调用 ,以 及 每 个 系统 调用 的 功能 和 和 使 用 方法 ， 
3. 编程 实现 

利用 学 到 的 原理 和 系统 调用 , 自己 编程 实现 原来 程序 所 实现 的 功能 。 
以 上 3 步 可 以 通过 下 面 3 个 问题 来 实现 : 

。 它 能 做 什么 ? 

« "Ed e SEIT 

， 能 不 能 自己 编写 一 个 ? 


1.4 从 用 户 的 角度 来 理解 Unix 


1.4.1 Unix 能 做 些 什么 


要 学 习 Unix 系统 编程 ,首先 看 看 Unix RETA. 下面 从 一 个 从 终端 登录 到 系统 中 
的 普通 用 户 的 角度 来 看 Unix 是 什么 , 它 能 做 些 什么 。 


1.4.2 登录 一 运行 程序 一 注销 


使 用 Unix 的 过 程 一 般 如 下 : 登录 到 系统 中 ,运行 程序 ,工作 结束 后 再 注销 。 登 录 的 时 候 
过 输 人 用户 名 和 密码 : 


Linux 1.2.13 (maya) (ttypl? 
maya login: betsy 
Password; - 


登录 到 系统 中 以 后 ,就 可 以 运行 备 种 各 样 的 程序 了 ,比如 收发 邮件 程序 .科学 计算 程序 
以 及 游戏 程序 。 

运行 程序 也 很 简单 , 当 显 示 器 上 出 现 提示 符 后 (一 般 是 ”*$”), 输 入 程序 的 名 字 , 按 回 车 ， 
程序 将 开始 运行 。 运 行 结束 后 ,提示 符 再 次 出 现 。 

图 形 用 户 界 面 的 操作 方式 实际 上 也 是 这 样 的 。 图标 和 菜单 可 以 看 作 是 提示 符 , 双击 图 
标 就 像 运 行 命令 一 样 ,系统 会 把 双击 操作 解释 为 相应 程序 的 执行 。 

运行 完 程 序 后 ,可 以 从 系统 中 注销 : 


5 exit 


在 有 些 系 统 中 ,可 以 通过 输入 logout 或 按 组 合 键 Ctrl 十 站 来 注销 ， 

它 是 如 何 工作 的 昵 ? 

这 看 起 来 很 简单 ,但 系统 在 内 部 是 如 何 处 理 的 吡 ? 

首先 来 看 登录 过 程 。 人 们 常 说 使 用 计算 机 就 像 使 用 自己 的 汽车 一 样 , 这 昆 个 人 计算 机 
中 的 概念 ,问题 在 于 Unix 允许 许多 用 户 , 可 能 是 几 十 其 至 几 百 人 人 ,同时 登录 到 系统 中 ,系统 
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是 如 何 对 这 么 多 的 用 户 进 行 管理 的 呢 ? 

在 登录 过 程 中 , 当 用 户 名 和 乌 码 通过 验 于 后 ,系统 会 启动 一 个 叫 shell 的 进程 ,然后 把 用 
户 交 给 这 个 进程 .由 这 个 进程 处 理 用 户 的 请 求 。 每 个 用 户 都 有 属于 自己 的 shell CE, 

图 1.7 ZAP SRE Unix 系统 中 的 示意 网 。 





B] 1.7 用 户 登 录 到 系统 


图 1.7 中 左边 的 大 盒子 表示 计算 机 系统 , 坐 在 键盘 和 显示 器 前 的 是 用 户 , 计 算 机 里 有 内 
存 , 内 核 运行 在 内 存 中 ,shell 为 用 户 提供 服务 ,shell 和 用 户 之 间 的 连接 由 内 核 控制 。 

Shell 在 屏幕 上 最 示 出 提示 符 ,. 表 示 现 在 可 以 接收 用 户 的 办 人。 对 于 普通 用 户 而 言 查 示 
符 一 般 是 “和 ,也 可 能 还 会 显示 其 他 的 提示 信息 。 用 户 可 以 在 提示 符 后 输入 要 运行 的 程序 的 
名 字 ,内 核 负 责 把 用 户 的 输入 传 给 shell, 例如 ,运行 显示 日 期 和 时 间 的 程序 如 下 ; 


5 
5 date 
Sat Jul 1 21:34:10 EDT 2000 


3 


date 命令 显示 出 月 期 , 接 下 来 显示 命令 提示 符 。 
要 运行 其 他 命令 ,只 要 和 输 人 程序 名 即 可 ,Unix 中 有 一 个 程序 fortune, 下面 是 
例子 ， 


5 
ey 


S fortune 
Algol - 60 surely must be regarded as the most important 
programming language yet developed. 
-~ T. Cheatham 
S 


当 用 户 注销 时 ,内核 会 结束 所 有 分 配给 这 个 用 户 的 进程 。 
V E Fe tu fo] QE shell 进程 的 呢 ? shell 进程 是 如 何 得 到 输 人 的 程序 名 ,内 核 又 是 如 何 运 
行程 序 的 呢 ” 登 录 系 统 和 运行 程序 并 非 想像 的 那么 简单 。 这 些 细 节 会 在 第 8 Bite. 
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1.4.3 目录 操作 


用 户 登 录 后 ,可 以 对 白 己 的 文件 进行 操作 。 文 件 中 可 以 有 e-mail、 图片 . 源 程 序 、 可 执行 
程序 等 各 种 各 样 的 数据 。 文 件 被 组 织 在 目 订 中 。 

l. AR 

在 Unix 系统 中 ,文件 和 日 洪 被 组 织 成 树 状 结构 , Unix. 提供 相应 的 命令 来 对 日 录 进 行 
PETE 

图 1.8 是 一 个 日 录 树 的 例子。 


ita 
Fac] [me] [es] [] Ge] Dar] [ee 


D] [osi] [i 


图 1.8 日 录 树 的 一 部 分 


如 图 1.8 PRR MIP RR e/a RRA RRM SILT FAR. 
大 多 数 的 Unix RARER A KP A / etc. /home,/bin 等 几 个 子 目录 ,它们 都 有 特定 的 用 
途 , 比如 大 多 数 的 Unix 用 户 都 有 自己 的 主 划 录 , 而 一 般 来 说 用 户主 目录 就 在 /home 目录 中 。 

Unix 系统 中 有 很 多 命令 都 与 目录 有 关 , 如 新 建 日 洪 . 删 除 目录 ,改变 当前 目录 、 列 出 目 菏 
内 容 等 , 读 完 本 节 的 内 容 后 可 以 自己 试 一 试 这 些 命令 ， 

2， 目 承 操 作 命 令 

(1) ls Sin A RA 

ls d BS fF HH de 9) IB ELOR RS PLE «BE AA BUE EI GER B CAF AR RAMA 1s B z 
Hi m E 4A A RAYE. SA ls dirname, 6 A * iH AY dirname 所 指定 的 目录 的 内 容 ， 
如 输入 : 





ls /etc 


会 列 出 /etc HKEE A S B9 SC PEUT. Bos e] Pig. Vr SR f AL 


ls 7 


zs 3 HR Ba AA 
(2) ed 改变 当前 目录 





ed 命令 的 作用 是 改变 当前 的 目录 。 当 刚刚 登录 到 系统 中 时 ,当前 目录 是 自己 的 主 且 录 ， 
可 以 通过 cd 命令 转 到 其 他 目录 ,如 : 


ee ee ie 


tte "IU, ———2À 


cd /bin 


Ape yl bin 目录 下 ,这 个 目录 中 有 很 多 系统 命令 ,可 以 用 1s 查看 有 哪些 命令 。 通 过 下 述 命令 
转 到 上 一 层 目 深 : 


cd.. 
Ait 24 Bii RETA ,通过 下 述 命令 都 可 以 立即 回 到 用 户 的 主 目录 : 


cd 


(3) pwd 一 一 显示 当前 目录 | 
pwd fip & iF A ARETA, EF EREE. BAR H eT 36 B FEET «9D: 


$ pud 


/home/cse215/samples 


从 上 述 操作 可 以 知道 ,当前 目录 是 通过 从 根 目 录 开 始 , 依 次 进 和 人 home. cse215 samples 
来 得 到 。 

(4) mkdir,rmdir 新 建 ,删除 目录 

用 mkdir 来 新 建 目 录 , 如 : 





$ ed 
S mkdir jokes 


Jtt AGEBGk.fA EX BR PRY jokes 这 样 一 个 目录 。 一 般 来 说 ,只 能 在 自己 的 目 
录 中 新 建 目 录 而 不 允许 在 其 他 用 户 的 目录 中 新 建 目 录 。 
要 删除 一 个 已 经 存在 的 目录 ,可 以 用 rmdir 命令 ,如 : 


$ rmdir jokes 


如 果 jokes 和 录 是 空 目录 , 那 这 个 命令 可 以 把 jokes 删除 。 注 意 用 rmdir 来 删除 目录 , 必 
须 先 把 号 录 中 的 文件 和 子 目 录 删 除 或 移 走 。 

3， 目录 操 作 命令 的 工作 原理 

从 刚才 的 分 析 可 以 知道 硬盘 上 的 目录 和 文件 构成 了 一 棵 目录 树 , 树 的 中 间 结 点 是 目录 ， 
每 个 目录 又 可 以 包含 很 多 的 子 目录 和 文件 ,可 以 新 建 或 删除 目录 ,可 以 从 一 个 目录 转 到 其 他 
"IE 

然而 这 些 是 如 何 工作 的 呢 ? 首先 来 考察 硬盘 ,硬盘 是 由 很 多 片 金属 或 玻璃 的 盘 片 组 合 
起 来 构成 的 ,这 些 盘 片上 可 以 保存 磁性 信息 ,问题 是 目录 在 哪里 ? 用 户 在 自己 的 主 目录 中 意 
际 着 什么 > 转 到 其 他 目录 又 意味 着 什么 ? Unix 允许 很 多 用 户 同时 登录 到 系统 中 ,他 们 可 以 
有 相同 的 当前 目录 ,也 可 以 在 不 同 的 目录 中 ,会 不 会 因为 很 多 用 户 在 同一 个 目录 中 导致 这 个 
目录 过 分 拥挤 ? 还 有 的 问题 是 ,如 果 要 自己 来 编写 一 个 改变 当前 目录 的 程序 ,该 如 何 来 实 
BL? 内 核 在 这 棵 目录 树 中 扮演 什么 角色 ? 
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1.4.4 文件 探 作 


文件 存放 在 目录 中 ,用 户 文 件 位 于 用 户 自 己 的 主 昌 录 中 ,系统 文件 位 于 系统 目录 中 。 对 
文件 的 操作 有 哪些 呢 ? 

1. 文件 操作 的 命令 

(1) 文件 命名 规则 

每 个 文件 都 有 文件 名 TERK SR Unix 系统 中 ,文件 名 最 长 可 以 是 250 个 字符 ,很 多 字 
符 都 可 以 出 现在 文件 名 中 ,如 大 小 写字 符 、 标 点 符号 .空格 .tab, 甚 至 回 车 符 , 介 是 不 能 包含 根 
Hof. 

(2) cat, more,less.pg— — £ & X: PE BJ EJ 

上 上 述 命 令 都 可 以 用 来 查看 文件 的 内 容 , 但 也 有 些 细微 的 差别 ,cat 一 下 子 列 出 文件 的 所 有 
PS 


5 cat shopping - list 
soap 

cornflakes 

milk 

apples 

jam 


$ 
当 文 件 的 内 容 比 较 多 ,在 一 屏 内 显示 不 完 时 ,more 会 更 加 合适 : 


¢ more longfile 


显示 一 屏 后 会 暂停 输出 ,这 时 用 户 按 空 格 键 , more SRSA PH. n TR TF a] es We 
显示 下 一 行 , 输 入 *q" 则 退出 。 另 外 两 个 命令 less 和 pg 的 功能 与 more ATARI. 

(3) cp 文件 复制 

可 以 用 cp 命令 米 复 制 文件 ,如 : 





S cp shopping- list last. week. list 


将 文件 shopping - list 复制 一 份 ,新 的 文人 性 名 为 last. week. list, 
(4) rm 一 -文件 删除 
删除 文件 的 例子 如 下 : 


5 rm old. data junk shopping. june1992 


一 次 删 掉 了 3 个 文件 。 

Unix 并 不 提供 恢复 被 删除 文件 的 功能 ,其 中 一 个 原因 是 Unix 是 一 个 多 用 户 系 统 , 当 一 
个 文件 被 删 掉 以 后 , 它 所 占用 的 存 悄 空间 可 能 被 立即 分 配给 其 他 用 户 的 文件 ,有 可 能 其 块 磁 
盘 空间 刚才 还 是 你 的 学 期 论文 ,下 -- 个 时 刻 就 变 成 了 另外 一 个 用 户 的 避 程 序 , 所 以 成 功 恢复 
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的 可 能 性 很 低 。 
(5) mv -一 重 命名 或 移动 文件 
mv 命令 可 以 更 改 文 件 名 或 动 文 件 ,如 


5 mv progl.c first _progran.¢ 


将 文件 progl.c " ,新 的 名 字 是 first program, cs 
也 可 以 移动 文件 , 即 改 变 文 件 的 位 置 ,如 : 


5 mkdir mycode 
5 mvfirst program.c mycode 


新 建 一 个 目录 mycode, 然 后 将 first. program. c 移动 到 这 个 目录 中 。 
(6) lpr. 1 一 一 打印 文件 
Fi [pr 来 打印 文件 ,如 : 


$ lpr filename 


上 述 命 令 把 filename 送 到 默认 的 打印 机 打印 ,很 多 大 型 系统 有 不 止 一 台 的 打印 机 ,可 以 
通过 lor 命令 指定 用 万 一 台 打 印 , 在 有 些 系 统 中 ,可 用 ip 命令 来 完成 tpr 的 工作 ， 

2. 文件 择 作 命令 的 工作 原理 

从 用 户 的 角度 来 看 ,文件 是 数据 的 集合 ,文件 中 的 数据 是 如 何 存储 在 磁盘 上 的 ? 文件 是 
如 何 被 复制 的 ? 如 何 移动 和 改名 的 ? 进步 来 讲 , 文 件 的 名 字 存 放 在 哪里 ? 作为 一 个 系统 
程序 员 ,必须 能 够 问答 这 些 问 题 , 而 这 些 问 题 的 管 案 就 在 Unix 系统 中 ， 

3. 文 忻 许可 权限 

系统 中 每 个 用 户 都 有 自己 的 文件 ,出 于 很 多 原因 ,你 不 会 希望 别 的 用 户 能 够 修改 自己 的 
文件 ,甚至 读 也 不 行 。 系 统 中 有 一 些 管理 命令 ,如果 使 用 得 不 好 会 对 系统 造成 损害 ,管理 员 
不 希望 普 笨 用 户 也 有 运行 这 些 傅 令 的 权力 。 这 些 对 文件 和 命令 操作 的 限制 是 好 何 行使 的 嘱 ? 

Unix 通过 一 些 文件 属性 来 对 文件 和 命令 的 操作 进行 控制 。 每 个 文件 都 有 文件 所 有 者 
(owner) 和 文件 许可 权限 ， 文 件 所 有 者 指明 了 系统 中 某 -- 个 用 户 ,文件 的 创建 者 就 是 文件 所 
B3. 

文件 许可 权限 分 为 3 组 ,通过 1s -1 命令 可 以 看 到 ， 


$ ls - 1 qutline. 01 
—rwxr-x--- 1 molay users 1064 Jun 29 00,39 ovtline. 01 


-i 称 为 命令 行 选 项 ,选项 -1 使 得 1s 输出 文件 的 详细 信息 。 同 一 个 命令 ,可 以 通过 不 同 
的 选项 ,使 它 所 做 的 工作 稍 有 不 同 。 这 里 的 文件 详细 信息 包含 文件 的 许可 权限 ,文件 所 有 
者 文件 长 度 . 最 后 修改 时 间 等 ,其 中 的 "rwxr-x--- ”就 是 文件 许可 权限 。 

每 个 文件 都 有 文件 所 有 者 和 3 组 许可 权限 ， 
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一 TWX rwx TT WX T réad, w write, x, executé 


user group other 


与 3 组 许可 权限 相对 应 ,用 户 也 被 分 为 3 组 : user MIF AA: group;: 与 文件 所 有 者 癌 
组 的 用 户 ; othe AA. BAMA PABST LL A 3 种 权限 : 读 权 限 、 写 权限 和 执行 权限 。 
这 样 针 对 不 同 用 户 一 共 是 9 个 权限 ,这 些 权限 可 以 分 别 设 定 , 如 可 以 指定 其 他 用 广 只 能 修改 
文件 而 不 能 读 文 件 ,文件 有 所 有 者 甚至 可 以 取消 自己 读 自己 文件 的 权限 。 

4, CHG TM OY LH RB 

文件 许可 权限 是 如 和 何 工作 的 ? MARR B? 系统 是 如 和 何 应用 刚才 讲 到 的 权限 的 ? 许可 
权限 存放 在 哪里 ? 在 后 续 的 章节 会 对 这 些 问题 做 解答 。 


1.5. 从 系统 的 角度 来 看 Unix 


1.5.1 用 户 和 程序 之 间 的 连接 方式 


前 面 的 小 节 从 用 户 的 角度 来 看 Unix 系统 ,用 户 登 录 到 系统 中 ,运行 程序 ,再 从 系统 中 退 
出 。 与 此 同时 ,可 能 有 很 多 其 他 用 户 也 在 登录 ,运行 程序 或 退出 系统 ;他 们 可 以 同时 对 一 个 
文件 进行 操作 ,好 像 工 作 在 各 自 独 立 的 裤 间 中 ,他 们 之 闻 还 可 以 通过 发 送 e-mail 或 即时 消息 
进行 沟通 . 

其 实 每 个 独立 的 空间 都 基 系 统 的 一 部 分 ;从 宏观 的 角度 来 看 ,系统 还 可 能 由 很 多 的 用 
P .很 多 程序 ,甚至 很 多 计算 机 系统 互相 连接 而 成 。 接 下 来 ,将 通过 3 个 例子 来 看 系统 是 如 何 
工作 的 ,如 何 编程 使 系统 中 的 不 同 部 分 做 到 协 润 统一 。 


1. 5.2 网 络 桥牌 


许多 人 都 玩 网 络 桥 牌 这 个 游戏 ,世界 各 地 的 玩家 通过 计算 机 网 络 连 接 到 一 起 ,游戏 开始 
以 后 ,参加 者 噬 可 以 看 到 一 个 共同 的 牌 扫 , 能 够 看 到 别人 人 出 的 牌 ,图 1.3 是 一 个 简单 的 说 明 。 


e f Le 
i B: 


图 1.9 + 个 人 通过 网 络 打 桥 牌 


图 1.9 中 有 4 个 人 ,他 们 每 人 都 有 一 台 计 算 机 ,通过 网 络 连 接 在 一 起 。 但 图 1.9 中 还 少 
了 有 牌 桌 , 下 面 把 它 加 上 ,如 图 1.10 Bp. 
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图 1.10 HR Lg 


图 1. 10 中 增加 了 第 5 个 实体 一 一 有 牌 桌 . 牌 桌 位 于 服务 器 上 ,在 4 个 玩家 的 眼 里 , 牌 是 放 
在 牌 桌 上 的 ,他 们 也 是 通过 牌 介 才 能 够 开始 洲 戏 。 

在 现实 生活 中 玩 牌 的 时 候 , 人 们 轮流 出 牧 , 但 在 网 络 游戏 中 ,是 由 以来 控制 该 哪 一 个 人 
出 牌 ? 牌 又 存放 在 哪里 ? 某 个 人 手中 有 几 张 牌 又 意味 着 什么 ? 如 何 来 保证 不 让 两 个 人 有 同 
一 张 牌 ”这 在 现实 生活 中 不 会 有 任何 问题 ,但 在 虚拟 的 网 络 中 确实 要 仔细 考虑 。 

图 1.11 显示 了 在 网 络 桥 牌 中 的 信息 流 ， 





图 1. 11 分 布 的 程序 向 其 他 用 户 发 送信 息 


阿 络 笑 牌 的 例子 展示 了 Unix 系统 编程 中 3 个 重要 的 方面 。 


CD 通信 
某 个 用 户 或 进程 如 何 与 其 他 用 户 或 进程 交换 信息 ? 
(2) 协作 


在 同一 个 时 刻 .网 络 桥牌 的 两 个 用 户 不 会 都 去 合同 一 张 牌 , 程 序 如 何 来 协调 多 个 进程 使 
他 们 能 够 没有 冲突 地 访问 共 他 资源 ? 

(3) 网 络 访问 

在 这 个 例子 中 ,互相 独立 的 计算 机 通过 网 络 连 接 到 一 起 ,那么 计算 机 中 的 程序 是 如 何 来 
使 用 网 络 的 呢 ? 


1.5.3 bc: Unix 的 计算 器 


Unix 系统 中 的 bc 命令 是 执行 一 个 基于 字符 的 计算 器 程序 .bc 有 两 个 重要 的 特点 , 稍 后 
ZWA. 要 启动 这 个 计算 器 .只 机 输入 : 
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$ be 
不 会 有 任何 的 版 本 信息 和 提示 信息 出 现 , 但 这 时 已 经 可 以 接收 输入 了 ,如 : 


2t3»4t5-»10 


be mni S ZR. E EX cf ik BEIM. BIB bc, 按 Ctrl 十 D 键 。 
bc 的 一 个 重要 特点 是 , 它 可 以 处 理 很 大 的 整数 ,如 ， 


9992353999299925399998 + 868868988688888888888 
BBSBBBBEBBSSBBBESBSSOT71111111:111111111112 


^ rígsp uA max TUB BITES: 


3333 ^ 44 
10110051584495640939500589840318228579482240528849807070336511^4 
17947694389041106492529115453814688907219481422090046883818703X 
5540915541156321905747562427309521 


3333 的 44 次 方 , 得 到 的 整数 足 足 有 两 行 半 那 么 长 ,be 还 是 可 编程 的 ,可 以 定义 变量 ,有 
逻辑 判断 和 循环 结构 ,语法 与 语言 类 似 , 如 ， 


x j 
AF (ox * 34 
y = X* 3; 

| 

a 

be 的 男 一 个 重要 特点 是 ,从 严格 的 意义 上 讲 ,be 并 不 做 任何 计算 。 为 了 说 明 这 一 点 ,做 
如 下 操作 : 

5 bc 

2 t 3 

3 


< 一 press Ctrl- Z here 


Stopped 

$ Ps 

PID TIT 5 TIME CMD 
29102  ttyp2 T 0:00.02 he 
27081 ttyp2 T 0.00.01 de - 
27560 ttyp2 1 6:00.59 - bash 
27681 ttyp2 T 0:00.00 be 


$ fg 
<—- press Ctrl - D here 


ps 命令 可 以 列 出 系统 中 运行 的 所 有 进程 ,这 里 一 共有 4 个 进程 ,除了 两 个 be 外 ,bash 是 
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shell 进 各 ,那么 dc 是 什么 ? 
在 大 多 数 的 Unix 系统 中 部 提供 了 联机 帮助 ,可 以 从 那里 得 到 需要 的 信息 ,要 找 关 于 de 
的 信息 .只 要 条 人 ， 


S man dc 

User Commands dc(1) 

NAME 
dc - desk caiculator 

SYNOPSIS 
dc [ filename | 

DESCRIPTION 
dc is an arbitrary precision arithmetic package . Ordinarily 
it operates on decimal integers, but one may specify an 
input base, output base, and a number of fractional digits 
to be maintained. The overall structare of dc is a stacking 
(reverse Polish) calculator. If an argument is given, input 
is taken from that file unril its end, then from the standard 


input. 


这 些 信 息 来 自 于 SunOS 5. 8 的 联机 帮助 ,大 多 数 Unix 系统 关于 dc 的 描述 都 是 类 似 的 ， 
它 说 明了 dc 是 一 个 计算 器 , 它 能 够 接收 道 波 兰 表达 式 , 算 出 表达 式 的 信 。 逆 波兰 表达 式 指 的 
是 操作 数 在 前 ,操作 符 在 后 ,也 称 做 后 级 表达 式 , 如 要 计算 表达 式 2+ 3 的 值 , 它 所 对 应 的 逆 波 
兰 表 达 式 是 23+ ,dc 的 输入 /和 输出 如 下 


2 
3 
+ 


p 
3 


内 部 进行 的 操作 是 这 样 的 : 先 将 2 人 栈 ,再 将 3 人 栈 , 然后 将 贱 顶 的 两 个 数 出 栈 , 计 算 它 
们 的 和 ,并 将 结果 入 栈 ,p 是 为 了 将 栈 顶 元 素 打印 出 来 。 这 样 可 以 知道 dc 是 一 个 基于 栈 的 计 
Beh IBA be 是 什么 ”de 的 运行 条 件 又 是 如 何 被 满足 的 呢 ? 

Be f bc 的 联机 帮助 就 会 知道 ,bc 是 dc 的 预 处 理 器 , 它 将 用 户 输入 的 表达 式 转 换 成 逆 波 
兰 表达 式 ,然后 通过 一 个 称 为 管道 (pipe) 的 通信 程序 交 给 dc, 如 图 1.12 R. 


224p. -—— 242 






图 1.12 程序 交换 信息 
用 户 输入 中 缀 表达 式 如 "2 十 2” ,bce 将 它 转化 为 想 应 的 后 缀 表达 式 形式 , 交 给 dc 执行 ,dc 
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计算 表达 式 的 值 ,将 结果 返回 给 be, be 再 将 结果 以 合适 的 形式 显示 在 显示 器 上 -。 所 以 对 普通 
FB Pie be SE EE ak 

与 网 络 桥牌 类 似 , 计 算 器 也 是 由 不 同 的 程序 互相 协作 构成 一 个 完整 系统 的 ,每 个 程序 有 
各 自 的 功能 ,互相 独立 、 相 互 协 作 。Unix 系统 编程 在 很 多 场合 下 ,就 是 要 解决 好 建立 这 些 独 
立 程序 之 间 的 连接 和 协作 方式 的 问题 。 


1.5.4 从 bc/dc 到 Web 


从 架构 的 角度 来 看 ,万维网 (World Wide Web) 与 bc/de 是 十 分 类 似 的 ， 通 过 刚才 的 学 
习 可 以 知道 be 负责 用 户 界面 ,dc 负责 后 台 运 算 , 在 万 维 网 中 ,浏览 并 负责 用 户 独 面 .在 后 面 
负责 提供 网 页 的 是 Web 服务 器 ,如 图 1.13 所 示 。 





图 1. 13 DFM aA Web IR $558 (8 


用 户 直 接 操作 浏览 器 ,从 浏览 器 上 看 到 网 页 的 效果 ,而 网 页 并 不 存放 在 浏览 器 上 ,而 是 
仔 放 在 Web 服务 器 上 .网 页 由 HTML 语言 写成 ,就 像 dc 的 语法 一 样 ,HTML 不 是 很 容易 理 
解 , 且 不 直观 . 用 户 端的 工具 一 一 浏览 器 就 像 be 一 样 ,从 服务 器 上 接收 到 信息 后 ,会 把 它 以 
容易 理解 的 形式 直观 地 显示 给 用 户 。 

所 以 说 万 维 网 与 be/dc 是 类 似 的 ,而 Web 首先 出 现在 Unix 平台 上 也 是 一 件 自然 而 然 的 
事情 ， 


1.6 动手 实践 


前 面 的 部 分 通过 两 个 问题 进行 学 习 , 它 们 是 “ 它 能 做 什么 ”” 和 “ 它 是 如 何 实现 的 ?” 接 下 
来 应 该 是 第 三 个 问题 了 :“ 能 不 能 自己 编写 一 个 ”。 在 本 节 试 着 自己 编写 一 个 程序 来 实现 
more 的 功能 。 

首先 ,more 能 做 什么 ? 

more 可 以 分 页 显示 文件 的 内 容 , 大 部 分 的 Unix 系统 都 有 文本 文件 /etc/termcap. 它 经 
A BMA A SS A RE FIL. Al more 来 查看 它 的 内 容 : 


$ more /etc/termcap 
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more 会 显示 文件 第 一 屏 的 内 容 , 在 评 幕 的 换 部 ,more BHREATH bos o FEBS E Ar E. ix 
时 如 果 按 空格 键 ,文件 的 下 一 屏 内 容 会 显示 出 来 ,如 果 按 回 车 键 ,显示 的 则 是 下 一 行 , 如 果 输 
A ,结束 显示 ,如 果 输 入 *h”, 显 示 出 来 的 是 more 的 联机 帮助 。 

注意 SE Eo UE A qiie. BU BIS hz :而 无 需 再 按 回 熙 键 。 

more 有 3 种 用 法 : 


S more filename 
5 command | more 


S more — filename 


第 一 种 情况 ,more 显示 文件 filename MAB; 第 二 种 情 癌 ,more 将 command 命令 的 输 
出 分 页 显示 ; 第 二 种 情况 ,more 从 标准 输入 获取 要 分 员 显 示 的 内 容 , 面 这 时 more 的 标准 输 
入 被 重 定向 到 文件 filename, 

第 二 个 问题 ,more 是 如 人 和 何 实现 的 ? 

通过 运行 more 并 观察 结果 可 以 知道 ,more 的 工作 流程 如 下 : 


十 一 ~ 人 一 show 24 lines from input 

| +--> print [more? | message 

| | Input Enter, SPACE, or q 

| *-- if Enter, advance one line 
二 一 一 一 一 gi SPACE 


if q -—-> exit 


搂 下 来 要 编写 的 程序 应 该 像 实际 的 more 一 样 , 有 足够 的 灵活 性 ,也 就 是 说 ,如 果 在 命令 
行 中 给 出 了 文件 名 ,那么 就 分 页 显 水 这 个 文件 ,否则 的 话 ,从 标准 输入 得 到 要 分 页 显示 的 内 
容 。 下 面 是 more 的 第 一 个 版 本 


/x more0l.c 一 version 0.1 of more 
* read and print 24 lines then pause for a few special commands 
x / 
# include < stdio. h> 
# define PAGELEN 24 
# define LINELEN 512 
void do morel FILE # )- 
int see more(); 
int main€ int ac, char * avf |) 
1 
FILE * fp; 
if (ac == 1) 
do more(stdin): 
else 
while ( -- ac) 
if ( (fp = fopen( * ttaàav, "r" >) i| NULL ) 
1 
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一 一 一 一 


do moret fp: 
fcloset fp 2; 
| 
else 
exit(1); 
return @; 
| 
void do morei FILE « fp) 


iat 


i 





—— — —— 


* read PAGELEN lines, then call see more() for further instructions 


i 


其 
char line| LINELEN | ， 
int num of lines - 0; 
int see more(), reply; 
while ( fgetst line, LINELEN, fp) )| 
if ( num of lines == PAGELEN } ! 
reply = see more(); 
if ( reply == 0) 
break; 
num of lines 一 = reply; 
f 
if ( fputs( line, stdout ) == EQF } 
exit(l): 


num of lines t; 


t 


int See_morer ) 


, 


j* 


/* more input */ 
/* full screen? x/ 
/* y, ask user x*/ 


/* n. done #/ 
/* reset count */ 
/* show line sr 


/* or die #/ 


/* count it x/ 


* print message, wait for response, return 4 of lines to advance 


* q means no, space means yes, CR means one line 


wf 
i 
int C; 
printf('"A033[ "7m more? N033[| n); 
while( (c = getchar(5) |= EOF ) 
1 
iL dq —— gt) 
return 0; 
Ib ee X*3 
return PAGELEN: 
if (e == ne ) 


return 1; 


/* reverse on a vt100 x»; 


/* get response */ 
fe gq > Na; 
/x t = next page x / 


/* how many ta show »/ 


/* Enter key => 1 line */ 
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return 0; 


f 


RERBA 3 PRM. TEA PHAM X UR AE ERA P RAE. EFI A A 
应 的 数据 源 ,然后 调用 do more PAS. do, more 将 数据 显示 在 显示 器 上 , 满 一 屏 后 ,调用 see 
more 消 数 接收 用 户 的 输入 ,以 决定 下 一 步 的 动作 。 编 译 并 运行 上 述 代 码 ， 


5 cc moreül.c - o noredl 


$ morel nore01.c 


这 个 程序 可 以 完成 基本 的 功能 ,显示 了 24 行 后 就 停 下 来 等 待 输入 ,而 且 在 屏幕 下 方 会 有 
反 白 的 提示 [more?|, 当 按 回 车 键 后 会 显示 下 一 行 。 


但 是 问题 也 是 存在 的 , 当 屏 幕 上 的 文字 上 滚 时 ,|more?| 也 会 随 之 上 滚 ,这 并 不 是 所 需要 
的 ,而 且 当 按 空格 键 或 输入 “gq” 后 ,如 果 不 按 回 车 键 , 那 程序 什么 也 不 会 做 。 

这 个 程序 还 需要 改进 ,但 是 通过 这 个 简单 的 例子 ,可 以 知道 以 下 事实 Unix SUB JB 
难 ,但 也 不 是 轻而易举 的 事情 。 

这 个 程序 的 目标 很 清晰 ,实现 算法 也 不 复杂 ,但 是 除了 算法 ,还 有 其 他 问题 需要 考虑 ， 

接 下 来 有 这 样 一 些 问题 ,如何 使 得 不 用 回 车 ,程序 就 得 到 输入 ? 如 何 计算 显示 的 百 分 


比 ?如 何 去 掉 反 白 的 [more?]? 
先 来 看 对 数据 源 的 处 理 , 在 main 函数 中 检查 命令 参数 的 个 数 , 如 果 没 有 参数 , 那 就 从 标 
准 输入 读 取 数据 ,这 样 一 来 more 就 可 以 通过 管道 重 定向 来 得 到 数据 ,如 ;: 


5 who | more 


who 命令 列 出 当前 系统 中 活动 的 用 户 , 管 道 命令 “1” 将 who 的 输出 重 定向 到 more 的 输 
A HR SE Uc Ro 24 个 用 户 后 暂停 ,在 有 很 多 用 户 的 情况 下 ,用 more 来 对 who 的 输出 进 
行 分 页 就 会 很 有 必要 。 

接 下 来 是 输入 重 定向 的 问题 ,看 以 例子 : 


5 ls /bin more0l 


期 望 的 结果 是 将 /bin 目录 下 的 文件 分 页 ,显示 24 行 以 后 暂停 

然而 实际 的 运行 结果 并 不 是 这 样 的 ,24 行 以 后 并 没有 暂停 而 是 继续 输出 ,问题 在 哪 
里 呢 ? 

当 more01 读 入 第 24 后 , 它 打 印 了 |more?j ,然后 等 待 用 户 的 输入 。 

用 户 的 输 人 是 从 哪里 来 的 ? 在 more01 中 用 getchar O , 它 是 从 标准 输入 读数 据 的 ,问题 
就 在 这 里 。 财 才 的 命令 : 


$ ls /bin | more0i 


已 经 将 more01 的 标准 输入 重 定向 到 ls 的 标准 输出 ,这 样 more01 将 从 同一 个 数据 流 中 读 用 
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户 的 输入 ,这 显然 有 问题 ,图 1. 14 描述 了 这 种 状况 。 








图 1.14 more JA. bk ME Sg A DERE 
48 rhe 4S fa] E 9 75 Hz Ri, MR ERA BEA Ay or OR CIS LE JA BARROW, 
如 图 1. 15 Pr, 
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Bj 1.15 PAP MA /dev/ ity, 3X E BEER TU On Ge) E F KP RASS 
T Won4ERI P B8 Ba ES RR A oe A / Bi" e 


“>? EGE [81 RP YR Ji BY LGB a ARAE . 
从 图 1. 15 中 可 以 知道 ,more 有 两 个 输入 ,程序 的 标准 输入 是 1s 的 输出 .将 其 分 页 显示 


到 屏幕 上 , 当 more 需要 用 户 输入 时 , 它 可 以 从 /dev/uty 得 到 数据 。 
运用 上 述 知识 改进 more01. c. 8 Ej more02. c; 


/* more02.c - version 0.2 of more 
¥ read and print 24 lines then pause for a Few special commands 


x feature of version 0.2; reads from /dev/tty for commands 


x 
# include «stdio.hL— 
& def ine PAGELEN 24 
it def ine LINELEN 512 
void do more(FILE x»); 
int see more(FILE x); 
int main( int ac, char wav | ) 
{ 
FILE * fp; 


ieee … -一 -. 
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rr 





if te == 1) 
do more( stdin ); 
else 
while ( 一 一 ac ) 
if ( (fp - fopen( * + tav, "r" 25) |= NULL) 
i 
do more( fp }; 
fclose( fp}; 
} 
else 
exit(1); 
return 0. 


j 


void do more( FILE x fp 3 
fy 


* read PAGELEN lines, then call see_more() for further instructions 


x / 
i 
char line| LINELEN] : 
int num of lines - 0; 
int see more(FILE *), reply; 
FILE * fp tty; 
fp tty = fopen( "/dev/tty", "r" ); 
if ( fp tty == NULL } 
exib(1)5; 
while { fgets( line, LINELEN, fp > )| 
it ( num of lines == PAGELEN ) | 
reply = see more(fp tty); 
if ( reply == 0) 


break, 
num of lines ~= reply; 
; 
if ( fputs( line, stdout ) == EOF > 
exit(1); 


num of lines t*:; 


} 


int see more(FILE x cmd) 
ES 


/* NEW: cmd stream x/ 
/* if open fails #/ 

/* no use in running */ 
/* more input x/ 

/* full screen? x/ 

/* NEW: pass FILE « */ 


/* n: done */ 
/* reset count x*/ 
/* show line x/ 


/* or die »/ 


/* count it x 


/* NEW. accepts arg */ 


* print message, wait for response, return # of lines to advance 


*q means no, space means yes, CR means one line 


x/ 
| 


int c; 
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priotf("\033[7m more? \033[m"); /* reverse on a vt100 x/ 
while( (c= gerc(cmd)) | = EOF ) /» NEW. reads from tty »/ 
| 
ifle == 'q') /* a -> N¥/ 
return 0; 
if (c == r) /* '' => next page r“ 
return PAGELEN; / * how many to show */ 
if (c == 'An') /x Enter key => 1 line «/ 
return 1; 
| 
return ©; 


} 
558 VET DU UST) EB : 


S cC - o more02 nmore02.c 


S ls /bin | more02 


more02. c 可 以 从 标准 输入 得 到 数据 ,也 可 以 从 键盘 得 到 用 户 的 输入 ,同时 通过 编写 
more02. c, 增 加 了 对 文件 /dev/itty TE. 

more02. c 还 和 需 要 进一步 完善 , 当 用 户 按 空格 键 或 箱 入 “q" 后 ,还 得 按 回 车 键 ,程序 才 会 动 
作 , 而 且 办 入 的 字符 会 显示 出 来 。 实际 的 more 是 不 需要 额外 的 回 车 的 ,而 且 和 输 和 人 的 字符 也 
不 会 回 显 。 

3、 对 输入 的 进一步 处 理 

用 户 操作 的 终端 有 很 多 参数 ,可 以 调整 参数 使 得 用 户 输 人 的 字符 被 立即 送 到 程序 ,而 不 
用 等 待 回 车 ,还 可 以 使 输入 的 字符 不 回 显 , 26 E 1. 16 Brom, 





图 1.16 终端 参数 是 可 调 的 


图 1. 16 中 新 加 入 部 分 是 用 于 调整 疼 端 参数 的 ,程序 运行 的 时 候 可 以 动态 地 调整 终端 的 
人 参数 。 

X 55-36: mor 还 有 很 多 工作 要 做 ,以 下 是 留 给 读者 的 问题 。 如 何 知道 文件 中 
己 显 示 的 百分比 ? 要 知道 百分比 就 必须 知道 文件 的 大 小 .这 些 信 息 操作 系统 是 提供 的 .需要 
用 合适 的 系统 调用 来 得 到 。 如 何 反 白 显示 文字 ? 如 何 确 定 每 一 页 的 行 数 ? 这 些 都 跟 终端 类 
型 有 关 , 如 果 将 每 一 页 定 为 24 行 .终端 类 型 定 为 vt100, 那 么 程序 就 缺乏 足够 的 灵活 性 。 如 
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何 使 程序 能 够 处 理 各 种 类 型 的 终端 ? 那 就 需要 学 习 如 何 控制 和 调整 终端 参数 的 知识 ， 
1.7 工作 步 怠 与 概要 图 


1.7.1 接 下 来 的 工作 步 又 


Unix 系统 是 一 个 多 用 户 系 统 , 它 允 许 很 多 用 户 很 多 程序 同时 工作 ,程序 经 常 对 文件 、 目 
录 进 行 操作 ,对 数据 进行 转换 或 传输 。 同 一 台 机 器 上 的 不 同 程序 之 癌 Me RR fe) Lat EFE 
之 间 通 过 网 络 都 可 以 互相 通信 ， 

这 么 多 复杂 的 程序 ,它们 的 功能 是 什么 ?是 如 何 工作 的 ?在 中 间 操 作 系 统 做 了 些 什么 ? 
随 着 学 习 的 深入 ,这 些 问题 会 越 来 越 多 地 被 解答 ， 

在 研究 more 的 过 程 中 展示 了 解决 问题 的 步 又 ,首先 分 析 一 个 实际 存在 的 程序 , 弄 清 人 它 
的 功能 ,分 析 它 的 实现 原理 ,然后 自己 编写 一 个 。 通 过 对 程序 的 不 断 完善 来 更 多 地 了 解 Unix 
系统 和 它 的 工作 原理 。 这 也 是 本 书 杀 用 的 主要 方法 。 


1.7.2 Unix 的 概要 图 


Unix 的 结构 如 图 1. 17 Bros. 





1.17 Unix 系统 的 主要 结构 


图 1. 17 描述 了 Unix 系统 的 主要 结构 ,内 存 被 分 为 系统 空间 和 用 户 空间 ,内核 和 它 的 数 
据 结 构 位 于 系统 空间 ,用 户 程序 位 于 用 户 空间 ,用 户 通 过 终端 连接 到 系统 ,文件 存放 在 了 磁盘 
上 ,各 种 各 样 的 设备 被 内 核 直 接管 理 , 用 户 程 序 可 以 通过 内 核 来 访问 设备 ,最 后 还 有 网 络 连 
接 , 用 户 可 以 通过 网 络 接 人 系统 。 

接 下 来 的 每 章 都 会 关注 系统 的 某 一 个 部 分 ,介绍 相关 的 系统 调用 逻辑 和 数据 结构 。 学 
完 本 书后 ,会 对 图 1. 17 中 每 一 个 部 分 者 有 所 了 解 ,应 该 能 够 编写 一 般 的 Unix 系统 程序 ,如 
Rd fs BEL. 

1.7.3 Unix 的 发 展 历程 
这 本 书 的 主要 内 容 是 介绍 Unix 的 系统 结 均 和 相关 概念 ,以 及 如 何 编写 Unix 程序 ,你 可 
会 间 Unix 从 哪里 来 ? 它 是 怎么 发 展 的 ? 在 这 里 简要 地 介绍 Unix 的 发 展 历程 。 

1969 年 ,贝尔 实验 室 的 计算 机 科学 家 发 明了 Unix, 最 初 的 Unix 是 由 内 核 和 一 些 工具 组 

成 的 , 它 并 不 是 一 个 商业 产品 ,实际 上 在 20 世纪 70 年 代 , 贝 尔 实验 室 向 大 学 和 研究 机 构 提 供 
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Unix, 包 括 完整 的 源 代码 , 仅 收 取 和 象征 忻 的 费用 。 贝 尔 实验 室 以 及 其 他 的 计算 机 科学 家 不 断 
地 改进 Unix. Bl 1980 年 ,一 些 公司 发 布 了 商用 的 Unix, 这 时 的 Unix 主要 分 为 两 个 系列 ,一 
个 是 ATSCT ATH System V, 另 一 个 是 加 利 福 尼 亚 大 党 伯 殉 利 分 校 的 BSD, 大 多 数 的 Unix 
都 源 自 上 述 两 个 Unix 版 本 。 几 年 后 ,伯克利 停止 了 BSD 的 研究 ,System V 则 被 销售 给 了 也 其 
他 公司 。 

Unix 在 商业 计算 种 研究 机 构 得 到 很 大 的 发 展 , 出 现 了 不 同 的 方向 ,如 有 些 Unix 的 实时 
性 就 很 出 众 。 虽 然 各 种 Unix 不 尽 相 同 , 但 Unix 的 核心 架构 和 其 主要 系统 调用 却 可 以 保持 
稳定 ,1980 年 AT&T 的 Unix 5 1991 4E ZE MK RRA Unix 会 有 很 大 不 局 ,但 1980 F 

写 的 Unix 程序 稍 加 修改 就 可 以 在 1991 年 的 Unix 上 运行 。 

那么 什么 是 Unix Re 只 要 有 与 这 些 版 本 类 似 的 结构 和 运行 特性 ,提供 应 有 的 系统 服 
3$ , 那 就 是 Unix。 由 于 不 同 机 构 对 Unix 的 不 断 发 展 , 现 在 有 些 系统 看 起 来 很 像 Unix. HE 
代码 里 却 看 不 到 System V 或 USB 的 影子 ,如 GNU/Linux, POSIX 标准 中 用 形式 化 的 方法 
描述 了 Unix 的 系统 接口 ,但 是 要 了 解 Unhix, 单 单一 个 标准 是 不 够 的 。 

Unix 有 很 长 的 发 展 历 史 和 不 同 的 版 本 ,所 以 ,一 本 书 所 能 涵盖 的 是 十 分 有 限 的 。 本 书 只 
描述 了 不 同 的 Unix 共有 的 原理 .技术 和 结构 ,各 个 不 同 版 本 的 Unix 的 特点 并 不 在 本 书 介绍 
的 范畴 内 。 

你 可 能 工作 在 SunOS 上 ,也 可 能 在 AIX 或 其 他 的 Unix 平台 上 ,关于 特定 平台 的 知识 可 
以 参考 所 使 用 平台 的 联机 帮助 ,实际 上 对 本 书 的 学 习 很 大 程度 上 要 借助 联机 帮助 . 

要 是 注意 的 话 就 全 发现, 有 时 候 一 项 功能 可 以 用 不 同 的 函数 来 实现 ,这 有 两 个 原因 。 一 
是 Unix 是 由 不 同 的 机 构 完 善 的 ,如 AT 入 和 工 和 HBSD,. 对 于 同一 个 要 解决 的 问题 ,他 们 采用 了 
不 同 的 函数 名 来 实现 。 另 一 个 原因 是 Unix 自身 的 发 展 需要 兼容 , 当 有 一 -个 新 的 服务 可 以 蔡 
代 老 的 服务 时 ,人 们 并 不 会 把 老 的 系统 调用 去 掉 , 而 是 增加 新 的 系统 调用 ,这 就 使 以 前 编写 
的 程序 也 可 以 顾 利 地 运行 。 在 本 书 中 也 有 这 样 的 情况 ,可 以 用 不 同 的 汞 数 来 做 同一 件 事 情 ， 
作为 系统 程序 员 ,这 是 经 常 的 和 不 可 避免 的 。 


小 结 


计算 机 系统 中 包含 了 很 多 系统 资源 ,如 硬盘 ,内存 .外 国 设 备 、 网 络 连 接 等 ,程序 利用 
这 些 资 源 来 对 数据 进行 存 赃 、 转 换 和 处 理 。 

多 用 户 系统 需要 一 个 中 央 管 理 程 序 , Unix 的 内 核 就 是 这 样 的 程序 , 它 可 以 对 程序 和 
资源 进行 管理 。 

。 用户 程 序 要 访问 设备 此 须 经 过 内 核 。 

€ 一 些 Unix 的 系统 功能 是 由 多 个 程序 的 协作 而 实现 的 。 

e 要 编写 系统 程序 ,必须 对 系统 调用 和 相关 的 数据 结构 有 深入 的 理解 。 
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概念 与 技巧 

> 联机 帮助 的 作用 与 使 用 方法 

^ Unix 的 文件 操作 国 数 open read, write Iseek , close 
。 文件 的 建立 与 读 写 

。 文件 描述 符 

。 缓冲 ; 用 户 级 的 缓冲 与 内 核 级 的 级 冲 

。 内 核 模式 APRA AR SES FB TUE 

* Unix a Ej [B] B 77 PRS EFT (8) 4t A BY I eR 
* fa ii urmp 文件 来 列 出 已 登录 的 用 户 

« 系统 调用 中 的 错误 检测 与 处 理 
相关 的 系统 调用 

* open,read,write,creat,Iseek,close 

* perror 

相关 命令 

* man 

e who 

* cp 

* login 


2.1 介 2H 


在 使 用 Unix 的 时 候 , 经 常 需要 知道 有 哪些 用 户 正在 使 用 系统 ,系统 是 否 很 繁忙 , 革 人 是 
否 正 在 使 用 系统 等 。 为 了 回答 这 些 问 题 ,可 以 使 用 who 命令 ,所 有 的 多 用 户 系统 前 会 有 这 个 
命令 。 这 个 命令 会 显示 系统 中 活动 用 户 的 情况 。 接 下 来 的 问题 是 , who 命令 是 如 何 工 作 
的 呢 ? 
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& ES Unix 中 的 who 命令 ,通过 分 析 来 学 习 Unix 的 文件 操作 。 除 此 之 外 ,还 将 学 习 
infa] JA Unix 的 联机 帮助 中 得 到 有 用 的 信息 ， 


2.2 关于 命令 who 


FET Unix 系统 的 概览 图 .如 图 2.1 所 示 。 





图 2.1 HIP X FIERE Vx dE PLA 


图 2. 1 中 最 大 的 长 方 体 代表 计算 机 内 存 , 它 被 分 为 用 户 空间 和 系统 空间 ,用 户 通 过 终端 
连接 到 系统 ,一 大 一 小 两 个 柱状 体 代表 两 个 硬盘 ,系统 中 还 有 一 个 打印 机 。 靠 上 方 的 3 个 较 
小 的 长 方 体 代表 3 个 应 用 程序 ,它们 运行 在 用 户 空间 ,通过 中核 与 外 界 进 行 通信 ,应 用 程序 和 
内 核 之 间 的 连 线 代表 通信 管道 。 

本 章 的 第 一 个 程序 通过 对 以 下 3 个 问题 的 解答 来 学 习 who HS 

1. who 命令 能 做 些 什么 ? 

2. who 命令 是 如 何 工 作 的 ? 

3. Un {af fay who"? 


命令 也 是 程序 


(ETT ui By ,需要 声明 的 是 ,在 Unix 系统 中 ,几乎 所 有 的 命令 都 是 人 为 编写 的 程序 .如 
who 和 1x. 而 且 它 们 中 的 大 多 数 帮 是 用 CC 语言 写 的 。 当 在 命令 行 中 输入 Is. Shell (命令 解释 
A BEAM ITAA TAFA ls 的 程序 。 如 果 对 js 所 提供 的 功能 还 不 满意 ,完全 可 以 编写 和 使 
AA Is are. 

在 Unix 系统 中 增加 新 的 命令 是 一 件 很 容易 的 事 。 把 程序 的 可 执行 文件 放 到 以 下 任意 
—"r FUE SE f RT: vbin、/usr/bin、usr/iocaljbin, 这 些 目 录 里 面 存放 着 很 多 系统 命令 ， 
Unix 系统 中 一 开始 并 设 有 这 么 多 的 命令 ,一些 人 编写 程序 用 来 解决 其 个 特定 的 问题 ,而 其 他 
人 也 党 得 这 个 程序 很 有 用 , 随 着 越 来 越 多 的 使 用 ,这 个 程序 就 次 渐 成 了 Unix 的 标准 命令 ，。 
说 不 定 哪 一 天 ,你 编写 的 程序 也 会 成 为 标准 命令 ， 
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———— ee 8 a a a i 


2.3 问题 1;: who 命令 能 做 些 什 么 


如 果 想 要 知道 都 有 谁 正 在 使 用 使 用 系统 ,只 有 输入 who 命令 ,输出 如 下 : 


4 who 

heckerl  ttypl Jut 21 19:51 (tide?5. surfcity. com) 

nlopez ttyp2 Jul 21 18:11 (roam163 一 141. student. ivy. edu) 
dgsulliv ttyp3 Jul 21 14;18 (h004005a8bd&4. ne, nediaone. net.) 
ackerman ttypd4 Jul 15 22:40 (asdl- 254. fas. state. edu) 
wwchen ttypS Jul 21 19:57 (circle, square. edu) 

barbier ttyp6 Jul 8 13:08 (labpclB.elsie.special. edu) 
ramakris ttyp7 Jul 13 08:51 (roam157 - 97. student. ivy. edu) 
czhu ttypS Jul 21 12:47 (spa. sailboat, edu) 

bpsteven ttyp9 Jul 21 18:26 (207.178.203.99) 

molay ttypa Jul 21 20:00 (xyz73 — 200. harvard. edu) 

S 


每 一 行 代表 一 个 已 经 登录 的 用 户 , 第 1 列 是 用 户 名 ,第 2 若是 终端 名 ,第 3 列 是 登录 时 
间 , 第 4 列 是 用 户 的 登录 地 址 , 某 些 版 本 的 who 命令 在 默认 状态 下 不 给 出 第 4 列 的 内 容 。 


阅读 手册 


通过 了 直接 运行 命令 ,可 以 了 解 who 的 大 致 功能 ,要 进一步 了 解 who 的 用 法 ,篇 要 借助 联 
机 帮助 。 

每 一 个 Unix 在 发 依 的 时 候 都 会 带 上 大 量 的 有 关 各 个 命令 使 用 方法 的 文档 。 以 前 ,这 些 
文档 是 打印 出 来 的 ,现在 有 电子 版 的 可 供 使 用 。 查 看 联机 帮助 的 命令 是 man. 如 要 查看 who 
的 帮助 .可 输 大 ， 


$ man who 
whot 1} 
NAME 
who — Identifies users currently logged in 
SYNOPSIS 
who | - a] |[ - AbdhHimMpgrstTu] [file] 
who am i 
who am I 
whoam 1 


The who command displays information about users and processes on the local systen. 
STANDARDS 


Interfaces documented on this reference page conform to industry standards as follows: 
who: XPG4, XPG4 -~ UNIX 
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Refer to the standards(5) reference page for more information about industry standards and 


associated tags. 
OPTIONS 


-a Specifies all options; processes /var/adm/utmp or tbe named file with all options on. 
Equivalent to using the - b, -d, -1, -p, -r, -t, —T, and -u options. 
nore( 10% ) 


所 有 命令 的 联机 帮助 都 有 相同 的 基本 格式 ,从 第 1 行 可 以 知道 这 是 关于 哪个 命令 的 大 
助 , 还 可 以 知道 这 个 帮助 是 位 于 哪 一 节 的 。 在 这 个 例子 中 ,从 第 1 行 的 内 容 who(1), 可 以 知 
道 这 是 who 命令 的 帮助 , 它 的 小 节 编 号 是 1, Unix 的 联机 帮助 分 为 很 多 节 , 如 第 1 小 节 中 是 
关于 用 户 命 令 的 帮助 ,第 2 小 节 中 是 关于 系统 调用 的 帮助 ,第 5 小 节 中 是 关于 配置 文件 的 帮 
助 。 你 可 查看 一 下 Unix 系统 的 联机 帮助 ,了 解 其 他 节 讲 述 的 内 容 。 

名 字 (NAME) 部 分 包含 命令 的 名 字 以 及 对 这 个 命令 的 简短 说 明 。 

概要 (SYNOPSYS) 部 分 给 出 了 命令 的 用 法 说 明 ,包括 命令 格式 .参数 和 选项 列表 。 选 项 
指 的 是 一 个 短线 后 面 紧 跟着 -个 或 多 个 英文 字母 ,如 -a、-Be, 命 令 的 选项 影响 该 命令 所 进 
行 的 操作 。 

在 联机 帮助 中 , 方 插 号 (| -aj) 表 未 该 选项 不 是 一 个 必须 的 部 分 。 帮 助 中 指出 who HS 
法 可 以 是 who ,或 者 who -a; 或 省 who -ME AbdhHlmMpqraiTu 这 些 字母 的 任意 组 合 , 在 
命令 的 末尾 还 可 以 有 一 个 文件 参数 ， 

从 帮助 中 可 以 知道 who 命令 还 有 其 他 3 种 形式 : 


who am i 
who am I 


whoami 


从 联机 帮助 中 还 可 以 获得 上 述 形式 的 进一步 大助。 

描述 (DESCRIPTION) 部 分 是 关于 命令 功能 的 详细 阐述 ,根据 命令 和 平台 的 不 同 ,描述 
的 内 容 也 不 同 ,有 的 简洁 ,精确 ,有 的 包 舍 了 大 量 的 例子 。 不 管 怎么 样 , 它 描述 了 命令 的 所 有 
功能 ;而 且 是 这 个 命令 的 权威 性 解释 ， 

选项 (OPTIONS) 部 分 给 出 了 命令 行 中 每 一 个 选项 的 说 明 。 早 期 的 Unix 命令 的 功能 都 
很 简单 ,每 个 命令 只有 一 了 两 个 选项 ,但 随 着 时 间 的 推移 ,命令 的 功能 越 来 越 多 ,基本 上 每 个 选 
项 用 来 实现 - … 个 功能 ,所 以 选项 也 越 来 越 多 , 像 who 命令 就 有 很 多 选项 。 | 

参阅 (SEE AI.SO) 部 分 包含 与 这 个 命令 相关 的 其 他 主题 。 有 些 帮助 还 有 BUG 部 分 。 


2.4 问题 2: who 命令 是 如 何 工 作 的 


前 面 看 到 who 命令 可 以 显示 出 当前 系统 中 已 经 登录 的 用 户 信 息 , 联 机 帮助 中 描述 了 
who 的 功能 各 用 法 ,现在 的 问题 是 : who 是 如 何 来 实现 这 些 功能 的 ? 
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你 可 能 会 认为 , 像 who 这 样 的 系统 程序 一 定 会 用 到 一 些 特殊 的 系统 调用 ,需要 高 级 管理 
员 的 权限 , 葛 编 写 这 样 的 程序 得 要 花 很 多 钱 来 购 头 系统 开发 工具 ,包括 光盘 .参考 书 等 。 

实际 上 ,所 需 的 资料 都 在 系统 中 EURO RS CDL RE m hp d ET 

1. 从 Unix 中 学 习 Unix 

以 下 4 项 技巧 会 有 助 于 你 的 学 习 : 

© 阅读 联机 黎 助 

© 搜索 联机 帮助 

。 阅读 .h 文件 

*。 从 参阅 部 分 (SEE AI.SO) 得 到 启示 

2. 阅读 联机 帮助 

以 who 为 例 ,在 命令 行 输入 如 下 命令 : 


S man who 


En abs. WERE SunOS 平台 上 ,可 以 看 到 如 下 内 容 : 


DESCRIPTION 


The who utility can list the user-s name, terminal line, login time, elapsed time since 


activity occurred on the line, and the process - ID of the command interpreter (shell) for 


each current UNIX system user. It examines the /var/adm/utmp file to obtain its information. 


If file is given, that file (which must be in utmp(4) format) is examined. Usually, file wiil 


be /var/adm/wtmp, which contains a history of all the logins since the file was last created. 


上 述 描述 说 明 ,已 登录 用 户 的 信息 是 放 在 文件 /varyadmyuatmp 中 的 ,who 通过 读 该 文件 


3. 搜索 联机 帮助 
使 用 带 有 选项 一 k 的 man 命令 可 以 根据 关键 宇 搜 索 联机 帮助 。 如 果 要 查找 “utmp” 的 信 


B ,在 命令 行 输入 如 下 命令 : 


$ man 一 k utap 


endutent 
endutxent 
qctutent 
getutid 
getutline 
getutmp 
getutmpx 
getutxent 
getutxid 
getutxline 
pututline 
pututxline 


setutent 


getutent (3c) 
qgetutxent (3c) 
getutent (3c) 
getutent (3c) 
getutent (3c) 
getutxent (3c) 
getutxent (3c) 
qetutxent (3c) 
getutxent (3c) 
getutxent (3c) 
getutent (3c) 
getutxent (3c) 
getutent (3c) 


获得 信息 。 可 以 通过 搜索 联机 帮助 来 了 解 这 个 文件 的 结构 信息 。 


access utap file entry 
access utmpx file entry 
access utmp file entry 
access utmp file entry 
access utmp file entry 
access utmpx file entry 
access utmpx file entry 
access utmpx file entry 
access utmpx file entry 
access utmpx file entry 
access utmp file entry 
access utmpx file entry 


access utmp file entry 
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setutxent getutxent (3c) access utmpx file entry 
ttyslot ttyslot (3c) find the slot in the utmp fiie of the current user 
updwtmp getutxent (3c? access utmpx file entry 
updrtmpa getutxent (3c) access utmpx file entry 
utmp ubmp (4) utmp and wtmp entry formats 
utmp2Zwtnp acct (1m) overview of accounting and miscellaneous accounting 
commands 
utmpd utmpd (1m) utmp and utmpx monitoring daemon 
utmpname getutent (3c) access utmp file entry 
utmpx utmpx (4) | utmpx and wimpx entry formats 
utmnpxname getutxent (3c) access utmpx file entry 
wimp utmp (43 utmp and wtmp entry formats 
wtmpx utmpx (4d) utmpx and wtmpx entry formats 
$ 


以 上 的 输出 是 在 SunOS 平台 上 的 和 输出 ,不 同 版 本 的 Unix 输出 可 能 会 有 所 不 同 , 其 中 每 
一 行 都 包含 帮助 的 主题 .标题 和 一 段 简 短 的 描述 .注意 这 一 行 : 


utmp utmp (4) — utmp and wtmp entry formats 


看 起 来 好 像 就 是 所 需要 的 。 这 一 行星 的 “4" 是 小 节 编 号 ,说 明 该 帮助 是 位 于 第 4 节 , 在 查 
看 该 帮助 内 容 的 时 候 , 注 意 别 把 小 节 编 号 漏 了 ， 


5 man 4 utmp 
Utmpt d) 
NAME 
utmp, wtmp - Login records 
SYNOPSIS 
5 include <lutmp. h> 
DESCRIPTION 
The utmp file records information about who is currently using the system. 


The file is a sequence of utmp entries, as defined in struct utmp in the utmp. h file. 


The utmp structure gives tbe name of the special file associated with the users terminal, the 
users login name, and the time of the login in the form of time(3), The ut type field is the type 
of entry, which can specify several symbolic constant values. The symbolic constants are 


defined in the utmp. h file. 


The wtmp file records all logins and logouts. A nuil user name indicated a logout on the 
associated terminal. A terminal referenced with a tilde ( —) indicates that the system was 
rebooted at the indicated time. The adjacent pair of entries with terminal names referenced by a 
vertical bar (|) or a right brace (}) indicate the system — maintained time just before and just 
after a date command has changed the systems time frame. 

The wtmp file is maintained by login(1) and init(B). Neither of these programs creates the 


file, so, if it is removed, record keeping is turned off, See ac(8) for information on the file, 
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FILES 
/usr/include/utmp.h 
/var/adm/utmp 

more( 88 X) 


到 此 已 经 高 目标 不 远 了 ， who 的 联机 帮助 说 明 who 要 读 utmp 这 个 文件 ,进一步 ,从 以 
上 的 说 明 可 以 知道 utmp 这 个 文件 里 面 保 存 的 是 结构 数组 ,数组 元 素 是 utmp 类 型 的 结构 ,下 
以 在 utmp. h 中 找到 utmp 类 型 的 定义 , 接 下 来 的 问题 是 ; utmp. h 这 个 文件 在 哪里 ? 

阅读 以 上 帮助 ,可 以 在 FILES 部 分 找到 utmp. h 这 个 文件 的 位 置 ,在 /usryincelude A 
录 里 。 

在 进行 下 一 步 ( 分 析 .h 文件 ) 之 前 ,还 有 些 东 西 要 引起 注意 ,上 述 帮 助 提 到 wtmop 这 个 文 
性 记录 了 关于 痘 录 和 注销 的 信息 , 它 涉及 到 以 下 几 个 命令 : login(1) init(8) Mac(8) ,这 些 命 
令 将 在 以 后 的 章节 讲 到 . 

通过 联机 帮助 来 学 习 Unix 就 像 在 网 络 上 寻找 信息 一 样 ,经常 能 从 某 一 个 帮助 主题 中 找 
到 相关 信息 ,链接 到 其 他 有 用 或 有 趣 的 主题 。 言 归 正 传 , 接 下 米 分 析 近 utmp. hx x ft. 

4. 阅读 .hh <4 

从 utmp 的 联机 帮助 中 可 以 知道 , utmp 中 的 数据 结构 定义 在 /usr/include/utmp. h F. 
在 Unix RAP X ux EESUE X /usr/inclide 这 个 目录 里 , 当 CC 语言 编译 器 在 源 程 
序 中 发 现 如 下 的 定义 ; 


# include < stdio. h> 


它 会 到 / usr/ include 中 寻找 相应 的 头 文 件 。 接 下 来 用 more 命令 来 查看 这 个 文件 的 内 容 ， 


6 more /usr/include;/utmp.h 


4 define UTMP FILE "/var/adm/utmp" 

# define WTMP FILE "/var/acdm/wtinup" 

+ include <(sys/types. h> /* for pid t, time t «/ 
x 


* Structure of utmp and wtmp files. 

x 

* Assuming these numbers is unwise. 

af 

# define ut name ut user /* compatibility #/ 


struct utmp | 


char ut user[32]; /* User login name x/ 

char ut id[ 14]; fx /ete/inittab id- IDENT LEN in init «/ 
char ut line| 32]; /* device name(console, lrx) »/ 

short ut type; /* type of entry x/ 

pid t ut pid; /* process id x/ 


struct exit status | 


short e termination; /* Process termination status x/ 
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short e exit; /* Process exit status w/ 
} ut exit; /* The exit status of a process marked as DEAD PROCESS > ' 
time t ut time; /* Time entry was made x/ 
char ut bost| $4]; /x Host name same as MAXNOSTNAMELEN «/ 


Es 
/* Definitions for ut type */ 
utap. h(60 5 > 


略 过 所 有 介绍 性 的 内 容 , HERA ump 结构 所 保存 的 登录 记录 。 它 包含 8 个 成 员 变 
量 .ut. user 数组 保存 登录 名 .ut_line 数组 保存 设备 名 ,也 就 是 用 户 的 终端 类 型 ,ul_time 保存 
登录 时 间 ,ut_host 保存 用 户 用 于 登录 的 远程 计算 机 的 名 字 。 

ump 这 个 结构 所 包 贪 的 其 他 成 员 没 有 让 who 命令 所 用 到 。 

各 个 平台 上 的 ump 结构 可 能 不 会 完全 相同 ,具体 的 内 容 由 ump. h KAE., ARRE 
量 来 看 , 其 中 的 绝 大 部 分 字段 在 大 多 数 的 Unix 平台 上 是 相同 的 ,被 标记 为 兼容 
《compatibility) 的 行 更 可 能 出 现 不 同 。 通 常 头 文 件 中 的 注释 提供 了 一 些 有 用 的 信息 。 


who 的 工作 原理 


通过 阅读 who 和 vimp 的 联机 帮助 ,以 及 头 文件 /usr/include/utmp. 了 h; 可 以 知道 who 的 
工作 原理 ,who 通过 读 文 件 米 获得 需要 的 信息 .而 每 个 登录 的 用 户 在 文件 中 都 有 对 应 的 记 
x. who 的 工作 流程 可 以 用 图 2. 2 RRR. 


打开 ttmp 


eH id 3 
显示 记录 | 
关闭 mp 





图 2.2 who 命令 的 数据 流 


文件 中 的 结构 数组 存放 登录 用 户 的 信息 ;所 以 直接 的 杞 法 就 是 把 记录 一 个 一 个 地 溪 出 
并 显示 出 来 ,是 不 是 就 这 人 么 简单 呢 ? 

虽然 没有 看 过 who AY TRACES {EARL E BP AT A T who 要 完成 的 功能 及 实现 原理 ， 
所 涉及 的 数据 结构 的 信息 也 可 以 从 头 文件 中 获取 。 接 下 来 是 实践 的 时 修了 ， 


2.5 问题 3: 如 何 编号 who 


接 下 来 要 编写 目 己 的 who 程序 ,为 了 能 够 顺利 完成 ,需要 经 常 从 联机 帮助 中 获取 信息 。 
测试 程序 时 ,要 把 程序 的 输出 与 系统 who 命令 的 给 出 做 比较 。 通 过 分 析 可 以 确认 ,在 编写 
who 程序 时 只 有 两 件 事情 是 要 做 的 ; 


ee i ee ee ee ee S a 
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© 从 文件 中 读 了 到 数据 结构 
”将 结构 中 的 信息 以 合适 的 形式 显示 出 来 


2.5.1 问题 : 如 何 从 文件 中 读 取 数据 结构 


可 以 调用 gete 和 fgets 函数 从 文件 中 读 字 符 或 字符 串 ,但 是 如 何 读 出 数据 结构 中 的 信息 
WE? 当然 可 以 用 getc 逐个 字 节 地 读 取 ,但 这 样 太 妹 琐 ,而 且 效 率 很 低 。 要 找 一 种 可 以 一 次 读 
出 整个 数据 结构 的 方法 。 

还 是 到 联机 帮助 中 寻找 答案 ,可 以 找 那 些 与 file fü read 都 有 关 的 帮助 ,但 是 man 命令 的 
选项 一 k( 根 据 关 键 字 查找 } 只 支持 一 个 关键 字 的 查找 。 在 我 的 系统 中 ,与 file 相关 的 主题 有 
53? 个 ,如 果 一 -个 一 个 地 来 看 ,这 就 太 槛 了 ,可 以 借助 Unix 命令 grep 来 从 这 537 个 主题 中 查 
找 与 read 相关 的 主题 ， 


5 man -kfile . grep read 


 llseek (2) - reposition read/write file offset 
fileevent (n) — Execute a script when a channel becomes readable or writable 
gfitype (1) — translate a generic font file for humans to read 
lseek (2) - reposition read/write file offset 
macsave (1) Save Mac files read from standard input 
read (2) - read from a file descriptor 
readprofile (1) - a tool to read kernel profiling information 
scr dump, scr restore, scr init, scr set (3) — read (write) a curses screen 


from (to) a file 
tee (1) 一 read from standard input and write to standard output and files 


其 中 最 有 可 能 的 是 read(2) ,其 他 的 看 起 来 都 不 像 , 所 以 进一步 地 看 read 2 B9 T8 BD: 


5 man 2 read 
READ 2) System calls READ( 2) 
NAME 
Read - read from a tile descriptor 
SYNOPSIS 


# include -unistd. k 
sgize_t read(int fd, void * buf, size t count); 

DESCRIPTION 
read() attempts to read up to count bytes from file descriptor fd into the buffer starting 
at buf. 
If count is zero, read() returns zero and has no other results. If count is greater than SSIZE- 
MAX, the result is unspecified. 

RETURN VALUF. 
On success, the number of bytes read is returned (zero indicates end of file), and the file 
position is advanced by this number. It is not an error if this number is smaller than the number 


of bytes requested; this may happen for example because fewer bytes are actually available 
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right now(maybe because we were close to end- of — file, or because we are reading from a pope, 
or from a terminal), or because read() wes interrupted by a signal. On error, - 1 is returned, 
and errno 18 set appropriately. In this case it is left unspecified whether the file position(if 


any) changes. 


这 个 系统 调用 可 以 将 文件 中 一 定数 目的 字 节 读 人 一 个 缓冲 区 ,因为 每 次 都 要 读 人 一 个 
数据 结构 ,所 以 要 用 sizeof(struct utmp) 来 指定 每 次 读 人 的 字 节 数 。read 函数 需要 一 个 文件 
描述 符 作 为 输入 参数 ,如 何 得 到 文件 手 述 符 呢 ? 在 read 的 联 宙 帮助 中 的 最 后 部 分 有 以 下 
摘 述 : 


RELATED INFORMATION( called SEE ALSO in some versions) 
Functions; fcntl(2), creat(2), dup(2), ioct1(2)5, getmsq(2), lockf(3), lseek(2), mtio(7), 
open(2), pipe(2), poll(2), socket(2), socketpa:ri2), termios(4), streamio(7), opendir(3), 
lockf (3) 
Standards: standards(5) 


其 中 包含 对 open(2) 的 引用 .在 命令 行 输入 : 
S pan 2 open 


查看 open 的 联机 帮助 .从 open 中 又 可 以 找到 对 close 的 引用 ,通过 阅读 联机 帮助 ,可 以 知道 
以 上 3 个 系统 调用 都 是 进行 文件 操作 所 必需 的 。 


2.5.2 答案 : 使 用 open,read 和 close 


ERER 3 个 系统 再 用 可 以 从 utmp 文件 中 取得 用 户 登录 信息 ,这 3 个 系统 调用 的 联机 
帮助 会 包含 很 多 内 容 ,尤其 是 应 用 于 管道 .设备 和 其 他 数据 源 时 .会 涉及 很 多 不 常用 的 选项 
以 及 复杂 的 用 法 ,但 在 这 里 ,只 需要 关心 它们 最 基本 的 用 法 

l. 打开 一 个 文件 : open 

这 个 系统 调用 在 进程 和 文件 之 间 建 立 一 条 连接 ,这 个 连接 被 称 为 文件 描述 符 , 它 就 像 一 
条 由 进程 通 向 内 核 的 管道 .如 图 2. 3 所 示 。 


文件 描述 符 





图 2.3. 文件 描述 得 是 对 文件 的 连接 


open 的 基本 用 法 如 下 ， 
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open 

目标 打开 一 个 文件 
A i Pt it include < fentl, h> 
函数 原型 int fd 一 open(char * name, int how? 
参数 name x ft 

how O RDONLY, O WRONLY, or O_RDWR 
Xs [e] ff zs 吉 到 错误 

int W T E El 


要 打开 一 个 文件 ,必须 指定 文件 名 和 打开 模式 ,有 3 种 打开 模式 ; RERS Tes. 
Ay AS ZF O RDONLY,O_WRONLY. O_RDWR. 3x #6 2h & (F/usr/include/fentl. h 中 有 


AE ML 
FT FP 3 PEE VJ ERE EY BR RATT TE SERO P A A BE fe] 8 UR A BS V8 FL 
会 返回 一 1。 


错误 类 型 是 各 种 各 样 的 ,如 : 要 打开 的 文件 不 存在 。 即 使 文件 存在 ,也 可 能 因为 权限 不 
够 而 无 法 打开 ,或 者 是 无 权 访 问 文件 所 在 的 目录 。 在 open 的 联机 帮助 中 型 出 了 各 种 可 能 的 
错误 ,本 章 结尾 还 会 进一步 讨论 出 错 处 理 的 问题 。 

当 一 个 文件 已 经 被 打开 ,是 否 允 许 再 次 打开 呢 ? 这 种 情况 发 生 在 有 多 个 进程 要 同时 访 
问 一 个 文件 的 时 候 。Umix 并 不 禁止 一 个 文件 同时 被 多 个 进 牲 访问 ,如 果 禁 止 的 话 , 那 两 个 用 
户 就 无 法 同时 使 用 who 命令 了 。 

如 果 文 件 被 顺利 打开 ,内核 会 返回 一 个 正 整 数 的 值 , 这 个 数值 就 叫做 文件 描述 符 。 刚 才 
讲 过 ,打开 文件 会 建立 进程 和 文件 之 间 的 连接 ,文件 描述 符 就 是 用 来 惟一 标识 这 个 连接 的 ， 
如 果 同 时 打开 好 几 个 文件 ,它们 所 对 应 的 文件 摘 述 符 是 不 同 的 ,如 果 将 一 个 文件 打开 多 次 ， 
对 应 的 文件 描述 符 也 不 相同 。 

必须 通过 文件 描述 符 对 文件 进行 操作 ， 

2. A XERA.: read 

还 过 read AK KERAHE read 的 用 法 如 下 ， 





read 
目标 把 数据 读 取 到 缓冲 区 
头 文件 # include «unistd, bz 
B 函数 原型 B ssize t numread = read(int fd, void « buf, size t qty) 
参数 fd 文件 描述 符 


buf 用 来 存放 数据 的 月 的 缓冲 区 
ge ge a A 
返回 值 =] 3B El je x 
numread Ath jf Hz 


read 这 个 系统 调用 请 求 内 核 从 fd Birds ae P) X fe ERR dty 字 节 的 数据 ,存放 到 buf 
所 指定 的 内 存 空间 中 ,内 核 如 果 成 功 地 读 取 了 数据 ,就 返回 所 读 取 的 字 节 数 上 自 ,否则 返 
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[a] — 1. 

这 里 有 个 问题 ,就 是 最 终 读 到 的 数据 可 能 没有 你 所 要 求 的 那么 多 ,为 什么 呢 ? 可 能 是 因 
为 文件 中 剩余 的 数据 没有 要 求 的 那么 多 。 例 旭 :程序 要 求 读 1000 字 节 的 数据 ,而 文件 的 长 度 
A 500 个 字 节 ,那么 程序 就 只 能 读 到 500 字 节 。 当 读 到 文件 末尾 时 再 要 读 的 话 ,numread 会 
是 0, 因 为 已 经 没有 数据 可 该 了 。 

润 用 read 函数 时 可 能 会 鹃 到 的 错误 在 联机 帮助 中 有 详细 的 描述 。 

3. XB] XH: close 

当 不 需要 再 对 文件 进行 读 写 操作 时 ,就 要 把 文件 关闭 。clese 的 用 法 如 下 ， 


close 
目标 关闭 一 个 文件 
头 文件 # include «unistd. h> 
函数 原型 int result = eloseCint fa 
参数 fd 文件 描述 符 
—i jRBR 
adis 0 成 功 关 闭 


close 这 个 系统 调用 会 关闭 进程 和 文件 fd 之 间 的 连接 ,如 米 关 闭 的 过 程 中 出 现 错误 ， 
close 返回 一 1; 例 如 ; fd 所 指 的 文件 并 不 存在 。 其 他 可 能 遇 到 的 错误 在 联机 帮助 中 有 详细 的 
描述 。 


2.5.3 编写 whol.c 


sl E B IE CAA HRE SARA T who 的 工作 原理 ,知道 了 要 上 先 打开 文件 ,然后 读 
数据 ,最 后 关闭 文件 ,以 及 上 述 操作 所 需要 的 系统 调用 ,这 样 可 以 编写 如 下 代 胡 ， 


/* whol.c - a first version of the who program 

s open, read UTMP file, and show results 
xf 

# include < stdio. h> 

# include <_utmp. ho 

ft include < fcntl,h— 

H include < unistd. h> 


it define SHOWHOST /* include remote machine on output +/ 
int maint } 
i 

Struct utmp current record; /* read info into here »/ 

int utmpfd: /* read from this descriptor x*/ 

int reclen = sizeofíicurrent record); 

if ( (utmpfd = open(UTMP FILE, O BDONLZ)) == -1 ){ 


perror( UTMP FILE ); /* UTMP FILE is in utmp. h x, 
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exit(ci?; 


L 
| 


while ( read(utmpfd, &current record, reclen) == reclen ) 
show info(&current record); 

close(utmpfd) ; 

return 0; /* went ok #/ 


| 


这 段 代码 应 出 了 前 面 学 到 的 内 容 , 在 while 循环 内 从 文件 中 逐条 地 把 数据 读 取 出 来 , 存 
放 在 记录 current record 中 ,然后 调用 图 数 show_info 把 登录 信息 显 了 未 出 来 , 当 文 件 中 己 经 
没有 数据 时 ,循环 结束 ,最 后 关闭 文件 返回 。 

X EHT RAR perror; 这 是 一 个 系统 哨 数 ,使 用 这 个 函数 来 处 理 系统 报错 ,关于 错误 处 
理 在 本 章 结 尾 还 会 讨论 。 


2.5.4 显示 登录 信息 
TAE show info 的 第 一 个 版 本 , 它 的 功能 是 显示 utmp 记录 的 内 容 ，; 


im 
+ show info() 
* displays contents of the utmp struct in human readable form 
* * note« these sizes should not be hardwired 
af 
show info struct utmp x utbufp } 
{ 


printf("% -8.8s", utbufp- ut name); /* the logname */ 
printf" "); /* a space x/. 
printf(" € -8.8s", utbufp-7ut line); /* the tty x/ 
printf(" "); /* a Space #/ 
printf(" $ 101d", utbufp -— ut time); /* login time x/ 
printf(" "). /* a space x/ 

+ ifdef SHOWHOST 
printf("( $s)", utbufp—ut host); /* tbe host «/ 

H endif 
printf( An"); /* newline x/ 


f 


在 使 用 printi 函数 输出 时 ,使 用 了 定 宽 度 的 属 式 ,这 样 做 是 为 了 与 系统 的 who 命令 的 输 
出 一 致 ,ut_time 字段 是 以 long int 的 格式 输出 的 ,在 头 文 件 中 这 个 字段 被 定义 为 time t 类 
型 ,但 到 目前 还 不 知道 time t 类 型 的 数据 应 如 何 处理 。 

HERRER JIT: 

S cc whol.c - o whol 

5 whol 
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CAR 

system b — 952601411 í) 

run- leve 952601411 () 

957601416 () 

952601416 () 

952601417 ©) 

952601417 () 

252601418 () 

952601413 () 

9352601423 () 

952601566 () 

LOGIN console 952601566 ©) 


ttypl 958240522 (2 
shpyrko  ttyp2 964318862 (nasi — 093. gas. swamp. org) 
acotton ttyp3 964319088 (math - quest04. williams. edu) 
ttypd 964320298 () 
Spradlin ttyp5 963881486 (h00207Scé6adfb. ne. rusty. net) 
dkoh ttvp6 964314386 (128.103.223.110) 
spradlin ttyp7 964058662 (h002078c6adfb. ne. rusty, net) 
king ttyp8 964279969 (blade - runner. mit. edu? 
berschba ttyp9 864188340 (dudley. learned. edu? 
rserved  ttypa 963538145 (gique, eas, ivy. edu? 
dabel ttypb 964319455 (rcam193 — 27. student. state. edu) 
ttypc 964319645 (j 
rserved  ttvpd 963538287 (gigue. eas. ivy. edu? 
dkoh ttype 964288769 (128.103.223. 110) 
ttvpf 964314510 () 
molay ttyqo 864310621 (xyz73 - 200. harvard. edu) 
ttyqi 964311665 () 
Ltydq2 964310757 () 
ttyq3 964304284 () 
ttyg4 964305014 () 
ttyas 964299803 () 
ttyq6 964219533 O 
Lttyq? 964215661 0) 
cweiner  ttyq& 964212019 (roam175 - 157. student. stats. edu) 
ttyqa 964277078 ©) 
ttyq9 964231347 () 
$ 
将 上 述 输出 与 系统 who 命令 的 输出 做 对 比 ， 
5 who 


shpyrko ttyp2 Jul 22 22:21 (nasl - 093. gas. swamp. edu) 
acotton ttyp3 Jul 22 22:24 (math - guest04. Williams, edu) 
spradlin ttyp5 Jul 17 20:51 (h002078c6adfb. ne. rusty. net) 
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dicoh ttyp6 Jul 22 21:05 (128. 103. 223.110} 
sprédiin ttyp? Jul 19 22:04 (h002078c6adfb. ne. rusty. net) 
king ttyp8 Jul 22 11.32 (blade ~ runner, mit. edu) 


berschba ttyp? Jul 21 10-05 (dudley. learned. edu? 

rserved ttypa Jul 13 21-29 (gigue. eas. ivy. edu) 

dabel ttypb Jul 22 22-30 (roam193 - 27. student. state, edu) 
rserved ttypd Jul 13 21:31 (gigue. eas. harvard. edu) 

dkoh ttype Jul 22 16:46 (128.103.223. 110) 

molay ttygO Jul 22 20-03 (xyz73 — 200. harvard. edu) 

cweiner ttyq8 Jul 2i 16;40 (roam175 — 157. student. stats. edu) 
$ 


自己 编写 的 wh 已 经 可 以 工作 了 , 它 能 正确 显示 出 用 户 名 .终端 名 .远程 主机 和 名 ,但 跟 系 
统 的 who Wi RA RSH. SOE MAR. 

需要 改进 的 : 

。 消除 空 日 记录 

。 正确 显示 登录 时 间 


2.5.5 编写 who2.c 


针对 版 本 工 的 两 个 问题 ,继续 编写 who 的 第 2 个 版 本 ,解决 问题 的 方法 还 是 通过 阅读 联 
机 帮助 和 头 文件 。 

1. WR ERICK 

系统 所 带 的 who 只 列 出 已 登录 用 户 的 信息 ,而 刚才 编写 的 who 1 除了 会 列 出 已 登录 的 
AP ,还 会 显示 其 他 的 信息 ,而 这 些 都 来 自 于 utmp 文件 。 实 际 上 ump 包含 所 有 终端 的 信 
息 , 其 至 那些 尚未 被 用 到 的 终端 的 信息 也 会 存放 在 utmp 中 ,所 以 要 修改 刚才 的 程序 ,做 到 能 
够 区 分 出 哪些 终端 对 应 活 动 的 用 户 。 如 何 区 分 呢 ? 

一 种 简单 的 思路 是 过 渡 掉 那些 用 户 名 为 空 的 记录 ,但 这 样 做 是 有 问题 的 ,如 刚才 的 输出 
中 ,用 户 名 为 LOGIN 的 那 一 行 对 应 的 是 控制 台 , 而 不 是 一 个 真实 的 用 户 。 最 好 有 一 种 方法 
能 够 指出 其 一 条 记录 确实 对 应 着 已 登录 的 用 户 。 

TE / usr/include/utmp. h 中 ,有 议 下 内 容 : 


/* Definitions tor ut type */ 


+ define FMPTY 0 
# define RUN LVL 1 
# define BOOT TIME 2 
i define OLD TIME 3 
# define NEW TIME 4 
+ define INIT PROCESS 5 
“+ define LOGIN PROCESS 6 
E define USER PROCESS 7 
# define DEAD PROCESS 8 


/* Process spawned by "init" «/ 
/* A "getty" process waiting for login */ 


/* A user process x/ 
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ump 结构 中 有 一 个 成 员 ut_ftype, 当 它 的 值 为 ?7(USER_PRUOCESS) 时 ,表示 这 是 一 个 已 
经 登录 的 用 广 、 根 据 这 -一 点 ,对 原来 的 程序 做 以 下 修改 ,就 可 以 消除 空白 行 : 





show info( struct utmp x utbufp } 
+ 
if ( uthufp- ut type !- USER PROCESS ) /* users only */ 
return; 


printf(" € —-B8,8s", utbufp —-ut name); /* the username x/ 


f 


2. A TIRA XQ XR BR H IB] 
fe PRB Eg [B] RRM BSUS FEREARE. AREAS 
联机 帮助 和 头 文 件 。 在 联机 帮助 中 头 于 时 间 的 主题 很 放 , 在 命令 行 输入 : 


5 man - k tine 


SKS Kin. RSE TS Unix RSS 73 条 记录 ,而 在 为 一 个 Unix 系统 上 得 到 
了 97 条 。 当 然 可 以 几 着 眼珠 一 条 一 条 地 看 ,不 过 用 Unix Bar 89: TR KR A HS Z8 
是 一 个 更 好 的 方法 。 以 下 是 黄种 讨 泪 方法， 


S man -k time | grep transform 


S man -k time | grep - i convert 


18 Bic ok LY A Sl /usr/include/time. h 这 个 头 文件 ,这 里 而 有 很 多 有 用 的 信息 。 

(1) Unix 存储 时 间 的 方式 :time t 数据 类 型 

Unix 中 时 间 是 用 一 个 整数 来 表示 的 , 它 的 数值 是 从 1970 年 ] 月 1 日 0 时 开始 所 经 过 的 
秘 数 ,在 水 文件 time. h 中 有 以 下 内 容 : 


typedef long int time t; 


存储 时 间 的 结 梅 time t 实际 上 就 是 long int. 

(2) # time t 显示 出 来 : ctime 

ctime 将 表示 时 间 的 整数 值 转换 成 人 们 日 常 所 使 用 的 时 间 形 式 。 在 联机 帮助 的 第 3 节 有 
ctime 的 详细 说 明 : 


5 man 3 ctime 


CTIME(3) Linux Programmers Manual CTIME( 3) 


NAME 


asctime, ctime, gmtime, localtime, mktime ~ transform binary date and time to ASCII 


SYNOPSIS 
H include «time. h 
char + asctime(const struct tm » timeptr): 
char * ctime(const time t * timep); 
Struct tm * gmtimeCconst time t »* timep); 


struct tm * localtime{const time t * timep): 
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Lime t mktime(struct tm 关 timeptr); 


extern char * tzname|2 |: 
long int timezone; 


extern int daylight; 


DESCRIPTION 
The ctime(), gmtime() and localtime() functions all take an argument of data type time t which 
represents calendar time. When interpreted as an absolute time value, it represents the number 


of seconds elapsed since 00:00:00 on January 1, 1970, Coordinated Universal Time (UTC). 
The ctime() function converts the calendar time timep into a string of the form 
"Wed Jun 30 21:49:08 1993Xn" 


The abbreviations for the days of the week are Sun, Mon, Tue, Wed, Thu, Fri, and Sat. The 
abbreviations for the months are Jan, Feb, Mar, Apr, May, Jun, Jul, Aug, Sep, Oct, Nov, and Dec. 
The return value points to a statically allocated string which might be overwritten by 


subsequent calls to any of the date and time functions. The function also 


这 正 是 所 需要 的 ,在 omp 结构 中 有 一 个 time t 类 型 的 数据 ,而 最 终 需 要 的 是 类 似 于 以 
下 的 输出 ， 


Jun 30 21:49 


ctime( 3 ) BR Ay 32 sy A, — T 438 in} time. t 的 指针 ,返回 的 时 间 字 符 串 类 似 于 以 下 格式 : 


Wed Jun 30 21:49:08 1993\n 


pP hy uy PS IL PASA Iu, ak a 


注意 ; 并 不 是 所 有 的 字符 串 内 容 都 需要 ,需要 的 是 其 中 用 "人 "标识 出 来 的 部 分 , 接 下 来 就 
很 容易 处 理 了 ,将 ctime 返回 的 宇 符 串 从 第 4 个 字符 并 始 ,输出 12 个 字符 : 


printf("% 12,125" ctime(&t) +4) 


3. 把 刚才 学 的 两 点 综合 起 来 
现在 明白 了 如 何 消 除 空白 记录 和 如 何 正确 地 显示 ut_time 中 的 时 间 值 ,可 以 洗手 重新 绢 
5 whoe2.c 如下: 


/* who2,c - read /etc/utmp and list info therein 


* - suppresses empty records 
* — formats time nicely 
& / 


# include <stdio.h> 
# include ”< 所 unigstd, h> 
# include <Cutmp. h> 
jf include «< fecntl. h> 
# include «= time. h> 
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/* # define SHOWHOST x / 


void showtime(iong); 


void show info(struct utmp * }; 


int main() 
| 
struct utmp  utbuf; /* read info into here «/ 


int utmpfd; /* read from this descriptor +/ 


if ( (utmpfd = open(UTMP FILE, O RDONLY)) == -1{ 
perror(UTMP FILE): 
exit(1); 


while( read(utmpfd, &utbuf, sizeof(utbuf)) == sizeof(utbuf) ) 
show info( &utburf ); 
closeCutmpfd) ; 


return Q; 


4 show infol) 


* displays rhe contents of the utmp struct 

x in human readable form 

* * displays nothing if record has no user name 
x / 


void show info( struct utmp < utbufp > 


d 
I 


if ( utbufp —»ut type |= USER PROCESS ) 


return; 


printf(" $ —8.8s", utbufp---ut name); /* the lognamo x/ 
printf(" ")- /* a space «/ 
printf(" * ~8.8s", utbufp---ut line); /* the tty x/ 
PrFintEg "); /* a space «/ 
showtime( utbufp —-ut time ); /* display time */ 
+ ifdef SBOWHOST 
if ( utbufp —»ut host[0| I= 'XO' ) 
printf(" ( $s)", utbufp — ut host); /* the host «/ 
i endif 
printf('An"), /* newline x/ 


void showtime( long timeval ) 
fs 


* displays time in a format fit for human consumption 


ee cd ü 





who 


ve n am n en” 
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* uses ctime to build a string then picks parts out of it 
* Note: €12.12s prints a string 12 chars wide and LIMITS 
* it to l2chars. 


x! 


? 


| 


char * cp 


cp = ctime(&timeval); 


printf(" $ 12.12s" 


f 


4. 测试 who2.c 
为 了 使 于 对 比 , 先 关 掉 SHOWHOST 这 个 选项 ,编译 who2. c 将 其 结果 与 系统 所 带 的 
进行 比较 ， 


S cc Who2.c - o who2 


5$ who2 
rlscott 
acoL Lon 
spradlin 
spradlin 
king 
berschba 
rserved 
rserved 
malay 
CWe ler 


nnabavi 


5 who 
rlscott 
acotton 
spradlin 
spradlin 
king 
berschba 
rserved 
rserved 
molay 
Cweiner 


mnabavi 


$ 


ttyp2 Jul 23 01 
ttyp3 Jul 22 22 
ttyp5 Jul 17 20 
ttyp? Jul 18 22 
ttypé Jul 22 11 
ttyp9 Jul 21 10 
ttypa Jul 13 21 
ttypd Jul 13 21 
ttyq0 Jul 22 20 
ttyq8 Jul 21 16 
ttyxe Apr 10 23 


ttyp2 Jul 23 01: 
:24 
:51 
:04 
:32 
.05 
:298 
:3231 


ttyp3 Jul 22 22 
Lttyp5 Jul 17 20 
ttyp? Jul 19 22 
ttyp8 Jul 22 11 
ttyp9 Jui 21 10 
ttvpa Jul 13 21 
ttypd Jul 13 21 


ttygqd Jul 22 20; 
:4D 
:11 


ttyq8 Jul 21 16 
ttyx2 Apr 10 23 


:07 
24 
:51 
:0d 
,32 
:05 
:29 
31 
;03 
: dà 
zig 


OF 


03 


/* to hold address of time x/ 

/* convert time to string */ 

/* string looks like x/ 

/* Mon Feb 4 0046,40 EST 1991 +/ 
/* 0123456789012345. »/ 


Cpt4); /* pick 12 chars from pos 4 */ 
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将 who 与 系统 的 who 对 比 … 下 ,除了 其 些 字段 的 宽度 有 些 不 同 外 ,其 他 的 都 完全 一 致 
而 要 调整 宽度 也 是 很 容易 的 。 

这 里 的 who 只 列 出 了 3 个 字段 : AS LEO TURTLE o STIR] ,有 些 版 本 的 who 还 会 列 
出 用 户 所 在 主机 的 信息 ,这 个 功能 在 who? 中 通过 预 编 译 选 项 SHOWHOST 控制 。 


2.5.6 回顾 与 展望 


这 一 章 是 从 这 样 一 个 简单 的 问题 开始 的 ， Unix 的 who 命令 是 如 何 工作 的 ? 接 下 来 分 3 
步 走 ,首先 弄 清 who 的 功能 ,然后 通过 联机 帮助 和 头 文件 知道 了 who 的 工作 原理 ,最 后 ,通过 
编写 自己 的 who 来 检验 对 知识 的 掌握 程度 ， 

在 这 3 步 中 ,学 习 了 如 何 使 用 联机 帮助 ,如 何 使 用 头 文件 ,了 解 了 记录 登录 信息 的 utmp 
文件 的 结构 ,知道 了 Unix 处 理 时 间 的 方式 ,学 会 了 通过 相关 主题 来 获取 信息 ,这 些 知 识 对 掌 
握 Unix 编程 是 很 重要 的 。 首 过 编写 程序 ,更 抽 深 化 了 对 知识 的 理解 和 掌握 。 


2.6 编写 cpCIX RIS) 
在 who 命令 中 介绍 了 如 何 读 文件 , 接 下 来 要 通过 cp 命令 来 学 习 如 何 写 文件 ，。 
2.6.1 问题 1: ep 命令 能 做 些 什么 
cp 能 够 复制 交 件 ,典型 的 用 法 是 ， 
5 cp source ~ file target - file 


如 果 target- file 所 指定 的 文件 不 存在 ,cp 就 创建 这 个 文件 ,如 果 已 经 存在 就 覆盖 ,target 
-file 的 内 容 与 source ~ file 相同 。 


2.6.2 问题 2: cp 命令 是 如 何 创 建 / 重 写 文 件 的 


|. 创建 / 重 轨 文件 
创建 或 重 与 文件 的 一 种 方法 是 使 用 系统 调用 图 数 creat, creat 的 用 法 如 下 : 


creat 

目标 创建 / 重 写 一 个 文件 
头 文件 # include < fentl. hz 
函数 原型 int fd = creat(char * filename, mode, t mode} 
f£ filename Wee 

mode 访问 模式 
返 过 值 a 遇 到 钳 误 

id 成 功 创 建 


creat GVEA KEN :个 名 为 filename 的 文件 ,如 果 这 个 文件 厅 存 在 ,就 创建 它 , 如 果 已 
经 存在 ,就 把 它 的 内 容 清空 ,把 文件 的 长 度 设 为 0。 
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ee — á—— — À 


如 果 内 核 成 功 地 创建 了 文件 ,那么 文件 的 许可 位 (permission bits) 被 设置 为 由 第 2 TS 
数 mode 所 指定 的 值 , 如 : 


fd = creat( "addressbook" 06443; 


创建 一 个 名 为 addressbook 的 文件 , din JR xc PE IR E dE RA FTF WI fu Ri A 
rw-r-r-- 《参见 第 3 章 )。 如 果 文 件 已 经 存在 , 它 的 内 容 会 被 清空 。 任 一 -种 情况 下 ,fd SEA 
指向 addressbook 的 文件 描述 符 。 

d. NS IT 

用 write ASA E $T JF B CESARE. 





write 
目标 将 内 存 中 的 数据 写 人 文件 
! Xx " include «unisid, h> mE 
B 函数 原型 ssize t result = writeCint fd, void * buf, We pam 
参数 fd AP EAR TT 
buf 内 存 数 据 
amt 要 写 的 字 节 数 
返回 值 =] i $E 


num written MPAA 


write 这 个 系统 调用 告诉 内 核 将 内 存 中 指定 的 数据 写 人 文件 ,如 果 内 核 不 能 写 人 或 写 人 
失败 ,write 返回 一 1, 如 果 与 人 成 功 , 则 返回 写 人 的 字 节 数 。 

为 什么 实际 写 人 的 字 节 数 会 少 于 所 要 求 的 呢 ? 有 两 个 原因 ,第 一 个 是 有 的 系统 对 文件 
的 最 大 尺寸 有 限制 ,第 二 个 是 磁盘 空间 接近 满 7 了 。 在 上 述 两 种 情 沈 下 ,内 核 都 会 尽量 把 数据 
往 文 件 中 写 , 并 将 实际 写 人 的 字 节 数 返 回 , 所 以 调用 write 后 都 必须 检查 返回 值 是 否 与 要 写 
人 的 相同 ,如 果 不 同 ,就 要 采取 相应 的 措施 。 


2.6.3 问题 3: 如 何 编写 cp 
下 面 通过 编写 一 个 实际 的 cp 来 检查 对 知识 的 理解 ,程序 的 流程 如 下 : 


open sourcefile for reading 
open copyfile for writing 
+ —> reat from source to buffer 一 一 eof? 一 + 


| | write from buffer to copy | 


close sourcefile 一 一 一 一 一 一 一 一 一 一 一 十 


close copyfile 


图 2.4 显示 了 涉及 的 对 象 及 数据 流 的 走向 。 
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图 2.4 通过 该 和 写 来 复制 文件 


文件 在 磁盘 上 , 源 文 件 在 左边 ,右边 的 是 目标 文件 .进程 在 用 户 空间 ,缓冲 区 是 进程 内 存 
的 一 部 分 ,进程 有 两 个 文件 描述 符 , 一 个 指向 源 文件 ,一 个 指向 目标 文件 ,从 源 文件 中 恋 取 数 
据 写 人 缓冲 ,再 将 缓冲 中 的 数据 写 人 目标 文件 。 下面 就 是 实现 上 述 逻辑 的 代位， 


/** Cpl.c 
* version l of cp - uses read and write with tunable buffer size 
x usage: cpl src dest 
»/ 

# include <stdio.h> 

8 include <unistd.h> 

H include < fcentl. h> 


# define BUFFERSIZE 4096 
1 define COPYMODE 0644 


void cops(char x , char »); 


main(int ac, char x avi |) 
( 
int in fd, out fd, n chars; 
char buf [BUFFERSIZE]; 
/* check args «/ 


if Cac !* JX 
fprintf( stderr, "usage: X* s source destinationin", vw av); 
exit(1); 
} 
/* open files «/ 
if ( Cin_fd= open(av[ i], O RDONLY)) == -1) 


oops( "Cannot open ", av| 1 |). 


if ( (out. fd- creat( av[ 2], COPYMODE)) == -1) 
oops( "Cannot creat", av[2}); 
/* copy files «/ 
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while ( (n chars = read(in fd , buf, BUFFERSIZE)) = 0) 
if ( writet out fd, buf, n chars >) t= n cbars } 
cops("Write error to ", av[2]5; 
if (n chars == 一 1 》 
oops( "Read error from ", avl1]); i 
/* close files «/ 
if ( close(in fd) == -1 || closetout fe) == -1) 
oops("Error closing files",""); 
; 
void oops(char * s1, char * 82) 
1 
fprintf(stderr,"Error: *s", si); 
perrorís2): 
exit(1); 


1 
! 


编译 并 测 坛 上述 代码 : 


5 cc cpl.c -o cpl 

$ cpl cpl copy, of. cpi 

S ls +1 cpl copy. of. cpl 

-rw-r--r-- 1 bruce bruce 37418 Jul 23 03:12 copy. of. cpl 
-rwxrwxr-x 1 bruce bruce 37419 Jul 23 03:08 cpl 

$ emp cpl copy. of. cpl 

S 


用 Unix 所 带 的 文件 比较 工具 emp 对 上 述 随 个 文件 的 内 容 艇 比较 。cmp 没有 给 出 任何 
提示 ,说 明 它 们 的 内 容 完 全 相同 ， 
接 下 来 看 看 程序 对 错误 输入 的 反映 ,在 命令 行 输入 ; 


$ cpl xxx123 filel 


Error: Cannot open xxx123; No such file or directory 


$ cpl cpl /tmp 
Error; Cannot creat /tmp; Is a directory 


I BE 55 AH FAK BL Bir EUR MUR dT AIR ERE. RM xx Ze BELTS 
mH. BEDAE mis AB EE eR fr ES X fF. 


2.6.4 Unix 编程 看 起 来 好 像 很 简单 


who 命令 从 文件 中 读数 据 然后 以 一 定 的 格式 输出 ,cp 命令 从 一 个 文件 中 读数 据 然后 写 
入 到 玖 外 的 文件 中 ,它们 用 到 的 是 类 似 的 系统 调用 ,都 是 在 内 存 和 文件 之 间 交 换 数据 ,可 以 
从 联机 帮助 和 头 文 件 中 得 到 足够 的 信息 来 进行 编程 ， 

这 样 看 来 , Unix 编程 好 像 真 的 不 准 ,是 不 是 还 有 些 东 西 没 涉及 到 ? 答案 是 肯定 的 ,还 记 


LCTWHNHNI- 本 d dn. m 
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不 记得 那 3 个 亲 题 ?在 这 里 要 多 问 一 个 问题 , 如 何 使 你 的 程序 运行 得 更 加 有 效 ? 
2.7 ”提高 文件 1/0 效率 的 方法 : 使 用 组 神 


cpl 中 定义 了 BUFFERSIZE 这 个 常量 .用 于 标识 每 次 读 / 写 操作 的 数据 长 度 , 这 里 的 值 


是 4095, 接 下 来 是 个 很 重要 的 问题 ; 缓冲 区 的 大 小 对 件 能 有 影 啊 凤 ? 
2.7.1 缓冲 区 的 大 小 对 性 能 的 影响 


缓冲 区 的 大 小 对 性 能 有 很 大 的 影响 ,举例 来 说 ,用 和 邹 子 把 汤 从 一 个 硬 里 加 到 妃 一 个 斑 


里 ,用 较 大 的 扣子 就 可 以 少男 几 次 ,从而 节省 时 间 。 


对 文件 操作 而 言 也 是 这 样 的 ,来 看 对 一 个 2500 字 市 的 文件 的 copy 操作 : 


交 件 天 小 = 2500 字 节 
wR Bee RAL = 100 字 节 

那么 需要 25 次 readO WI 25 TX writer 
如 果 缓冲 区 大 小 = 1000 E 

ERA m S 31kreadO 3 MK writeO) 


把 缓冲 区 从 100 字 节 增加 到 1000 字 他 会 使 系统 调用 的 次 数 从 50 次 减少 到 6 dx ix 3C 


很 可 观 . 


复制 一 个 5MB 大 小 的 文件 ,不 同 的 缓冲 区 所 对 应 的 执行 时 间 如 下 ， 

缓冲 大 小 执行 时 间 /s 
i 50. 29 o 

4 | 12. 81 

16 3. 28 

32 0. 96 

128 0, 58 

256 0. 37 

512 0,27 

1024 0. 22 

2048 0. 19 

40865 0, 18 

8192 0. 18 

16384 0. 18 


系统 调用 是 需要 时 间 的 ,程序 中 频繁 的 系统 调用 会 降低 程序 的 运行 效率 。 


2.7.2 为 什么 系统 调用 需要 很 多 时 间 


为 什么 系统 调用 会 消耗 很 多 时 间 ? 参见 图 2.5 所 示 的 控制 流程 。 
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2.5 系统 测 用 时 的 位 制 流 图 


图 2. 5 中 用 户 进程 位 于 用 户 空 间 ,内 核 位 于 系统 空间 ,磁盘 只 能 被 内 尽 直 接 访问 .程序 
cpl FERKA r 6591 H SED LI SEMI read, 上 read 的 代码 在 内 核 中 ,所 以 当 read 调用 
发 生 时 DUI EJ ACRI PRISER BAA BRS WT A RAR En SESS (8) B3 

系统 调用 的 开销 大 不 仅仅 是 因为 楼 传输 数据 , 当 和 运行 内 核 代 码 时 ,CPU 工作 在 管理 员 
(supervisor, 又 称 超级 用 户 ) 模 式 , 这 对 应 于 一 些 特殊 的 堆栈 和 内 存 环 境 , 必 须 在 系统 调用 发 
生 夺 建立 好 。 系 统 调 用 结束 后 (read 返回 时 ),CPU 要 切换 到 用 户 模 式 , 必 须 把 堆栈 和 内 人 存 环 
壤 灸 复 成 用 户 程序 运行 时 的 状态 ,这 种 运行 环境 的 切换 要 消耗 很 多 时 间 、 

当 工 作 在 答 理 员 模 式 下 .程序 可 以 直接 访问 厂 盘 、 终端 .打印 机 等 设备 ,还 可 以 访问 全 部 
的 内 存 空 间 .而 在 用 户 模式 ,程序 不 能 直接 访问 没 备 , 也 只 能 访问 特定 部 分 的 内 存 空间 。 在 
运行 时 赣 , 系 统 会 根据 还 要 不 断 地 在 两 种 模式 间 切 换 。 管理 员 模式 和 用 户 模式 的 切换 与 
CPU 关系 很 大 ,CPU 中 有 特定 的 标记 来 区 分 当前 的 工作 模式 ,而 Unix RBM Wi BIR 
到 CPU 的 这 种 特点 ,才能 够 实现 不 同 工 作 模 式 向 的 良好 切换 。 

举 个 影片 超人 的 例子 , 当 肯 特 ( 生 话 中 的 超人 ) 要 从 用 户 模式 (普通 人 ) 切 换 到 管理 员 模 
式 ( 超 人 时 ,他 得 先 找 个 地 方 , 比 如 电 夯 亭 , 脱 下 西 归 , 摘 掉 有 眼镜 ,再 改变 发 型 , 变 成 超人 后 才 
能 去 报 救 别人 .事情 完了 了 仅 后 ,还 得 找 个 地方 变 加 党 通 人 。、 变 来 变 去 是 需要 时 间 的 ,要 是 肯 
符 整 天 忙于 变 来 变 去 ,就 不 会 有 太 多 的 时 间 来 拯救 人 类 了 7， 

在 计算 机 的 世界 中 也 是 一 样 ,要 是 CPU 把 太 多 的 时 间 消 耗 在 执行 内 核 代 吗 和 模式 切换 
上 ,就 不 可 能 有 很 多 时 则 来 执行 程序 中 业务 逻 撮 的 代码 或 提供 系统 服务 ,所 以 要 尽 可 能 地 减 
少 筑 式 间 的 切换 。 对 系统 来 说 这 种 时 间 上 的 开销 是 昂贵 的 ,那么 who 版 本 花费 在 读 、 写 数据 
的 时 间 开 销 有 多 大 呢 ? 


2.7.3 低 效率 的 who2.c 
每 次 从 ump 中 读 出 一 条 记录 ,就 如 同 要 施 3 THRE ,每 次 到 超市 去 买 一 个 鸡蛋 ,前 好 
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了 再 去 买 一 个 ,这 是 很 低 效率 的 方法 ,完全 可 以 一 次 把 3 个 鸡蛋 都 买 回来 对 于 who mE, 
可 以 一 次 读 和 多 个 记录 放 在 缓冲 区 中 ,下 面 是 实现 上 述 想法 的 伪 代 码 : 


getegg() 

if ( eggs left in carton == 0) 
refill carton at store 
if ( eggs at store == 0) 

return EndOfEggs 

| 

eggs left inu carton-- ; 

return one egg; 


| 


getegg 的 每 次 调用 会 从 篮子 里 拿 一 个 鸡蛋 TU A Je SE VK ARE EE EXKL ASRS 
了 才 需 要 去 超市 . 


Z3 WW, /usr/include/stdio. h 中 geic 的 代码 ,getc 的 实现 使 用 了 与 getegg 26 40D BJ ET. 
2.7.4 在 who2.c 中 运用 缓冲 技术 


在 who2. c 中 加 和 人 缓冲 机 制 可 以 提高 程序 的 运行 效率 , 接 下 来 要 把 getegg 中 的 想法 用 代 
码 实 现 ,如 图 2.6 所 示 。 


用 uunplib 来 缓冲 
niin ec Y val Fi utmplib, t Fs 的 FR CO EX 
得 下 一 条 urmp 记录 


utmplib. c P 307 PR X, ul tX A EP 
取得 6 条 记录 放 和 人 入 数组 中 


SAH 6 sx fo BR BOE a. Ave LR 
内 核 服务 重新 访 取 数据 





图 2.6 CAPSS MAKES vb 


用 一 个 能 容纳 16 个 uum p 结 攀 的 数组 作为 缓冲 区 ,在 图 2.6 中 标识 为 buffer, 就 像 你 一 


次 会 买 很 多 个 鸡蛋 一 样 ,buffer 可 以 存放 很 多 数据 。 编 写 utmp_next 隔 数 来 从 缓冲 区 中 取得 
下 一 个 utmp 结构 的 数据 。 


PARKERA main, tA FA utmp_next 来 取得 数据 , 当 缓 冲 区 的 数据 都 被 取出 
后 ,utmp_next $ WAE read, 通 过 内 核 再 次 获得 16 条 记录 充满 缓冲 区 。 用 这 种 方法 可 以 使 
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read 的 调用 次 数 碱 少 到 原来 的 1716。 
以 上 算法 在 utmplib. e PA L4 SE JI, 


/x utmplib.c - functions to buffer reads from utmp file 


* 

x functions are 

* utmp opení filename } " Open file 

并 returns — 1 on error 

并 utmp next( ) - return painter to next struct 
X returns NULL on eof 

* utmp closet) 一 close file 

x 

* reads NRECS per read and then doles them out from the buffer 
¥ 


# include | «stdio. hi» 

# include =< fenti- ho 

# include -<sys/types.h> 
d include <_utmp. h> 


并 define NRECS 16 
+ define NULEUT ((struct utmp * ?)NULL) 
+ define UTSIZE (sizeof(struct utmp)) 


static char | utmpbuf[NRECS + UTSIZE]. /* storage */ 
static int num recs: /* num stored x/ 
aLatic ant CUI LEX fx next to go x/ 
static int fd utmp = - 1; /* read from »/ 


utmp open( char * filename } 


i 


fd utmp = open filename, O RDONLY ): fs open it «/ 
Cur rec = num recs = 0; /* no recs yet «/ 
return fd utmp; /* report x/ 


struct utmp x utmp nextí) 
{ 
struct utmp * recp; 
if ( £d utmp == -1) /* error 了 x/ 
return NULLUT; 
if ( cur rec == num recs && utmp reload() ==0 } /* any more ? s/ 
return NULLUT; 
/* get address of next record x/ 
recp = ( struct utmp * ) &utmpbuf[cur rec * UTSIZE]; 
cur rectt ; 


return recp; 
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l 
int utmp reload) 


ox 


* read next bunch of records into buffer 


x! 


] 
L 


int amt read; /* read them in »/ 
amt read = readt fd utmp , utmpbuf, NRECS * UTSIZE }; /* how many did we get? #/ 
num recs - amt read/UTSIZE; /* reset pointer x/ 


cur rec = Q; 


f 


return num recs. 


utmp close() 


| 


if ( fd utmp = -13 /* don't close if not */ 


closet fd utmp 3; /* open x/ 


utmplib. c 包含 使 用 缓冲 区 所 需 的 变量 和 图 数 ,变量 num recs 记录 了 缓冲 区 中 的 数据 
个 数 , 变 量 cur rec 记录 了 缓冲 区 中 心 被 使 用 的 数 撕 的 个 数 。 

每 次 要 从 缓冲 区 中 读数 据 前 , 先 检 查 cur, rec 的 值 是 否 等 于 num_recs, 如 果 相 等 说 明 组 
冲 区 中 已 经 没有 可 用 数据 了 ,就 调用 read 从 硬盘 上 读数 据 来 填 满 缓冲 区 ,在 返回 数据 前 , 增 
Hi car rec 的 值 。 

PEE utmp_next 返回 指 回 结构 的 指针 ,utmplib.c 隐藏 了 实现 细节 ,提供 简单 清晰 的 操 
作 缓 冲 区 的 接口 。 


FII LET main: 

/* who3.c — who with buffered reads 
* | -— sgurpresses empty records 
* - formats time nicely 
+ — buffers input (using utmplib) 
#; 


# include — —stdio. ho 

# include <(sys/types. h> 
# include <{utmp. h> 

H include <fentl. h> 


# include — -— Lime. h> 
H define SHOWHOST 


void show infoí(struct utmp * 2: 


void showtime(time t); 
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int main() 


( 
struct utmp x utbufp, /» holds pointer to next rec x/ 


+ vEmp next(); /* returns pointer to next +/ 


if ( utmp_open( UTMP FILE == -1 ){ 
perror(UTMP FILE); 
exit(1); 
) 
while € ( utbufp = vtmp next() ) !* ((struct utmp # ) NULL) ) 
show :nfo( utbufp ); 
utmp closet ); 
return 0; 
| 
/* 
x show info() 


修改 后 的 主 函 数 没 有 直接 对 open read PEE close 进行 调用 ,而 是 调用 与 之 等 价 的 具有 组 
冲模 式 的 函数 接口 。 用 于 显示 的 函数 show info 没有 受到 任何 影响 ， 


2.8 内 核 缓冲 技术 
点 用 缕 冲 撤 术 对 提高 系统 的 效率 是 很 明显 的 , 它 的 主要 思想 是 一 次 读 人 大 策 的 数据 放 
人 缓冲 区 , 需 旨 的 时 候 从 缓冲 区 取得 数据 。 
内 核 使 用 缓冲 吗 


管理 员 异 式 和 用 户 模式 之 间 的 切换 需要 消耗 时 间 , 相 比 之 下 ,磁盘 的 L/O 操作 消耗 的 时 
间 更 多 ,为 了 提高 效率 ,内核 也 使 用 缓冲 技术 来 提高 对 磁盘 的 访问 速度 ,如 图 2. 7 所 示 。 


xc o] 







由 程序 建立 
fS ob [A 






内 核 缓 驯 区 (位 于 系统 空间 ) 


图 ?2.7 PER Pp CR E 5 rds 
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正如 ump 文件 是 用 户 登 录 记 录 的 集 人 台 , 磁 盘 是 数据 块 的 集合 ,内 核 会 对 磁 失 上 的 数据 
Ag rh, RR who 程序 缓冲 ump 记录 一 样 。 内 核 将 蔽 盘 上 的 数据 志 复 制 到 内 核 缓冲 区 
中 , 当 一 个 用 户 空间 中 的 进程 要 从 磁盘 上 读数 据 时 , 内核 一 般 不 直接 读 磁 盘 ; 而 是 将 内 核 缕 
冲 区 中 的 数据 复制 到 进程 的 缓冲 区 中 。 

当 进 程 所 要 求 的 数据 块 不 在 内 核 缓 冲 区 时 ,内 核 会 把 相应 的 数据 块 加 人 到 清 求 数据 列 
表 中 ,然后 把 该 进程 挂 起 ,接着 为 其 他 进程 服务 。 

一 段 时 和 间 之 后 (很 短 ), 内 楼 把 相应 的 数据 块 从 磁盘 恋 到 内 核 组 部 区 ,然后 再 把 数据 复制 
到 进程 的 缓冲 区 中 ,最 后 晚 瞪 被 挂 起 的 进程 ， 

理解 内 核 缓冲 技术 的 原理 有 助 于 更 好 地 掌握 系统 调用 read 和 write, read 把 数据 从 内 核 
缓冲 区 复制 到 进程 缓冲 区 ,write 把 数据 从 进程 缓冲 区 复制 到 内 核 缓冲 区 ,它们 并 椒 等 价 于 数 
据 在 内 核 缓 冲 和 磁 共 之 间 的 交换 ， 

从 理论 上 讲 ; 内 核 可 以 在 任何 时 候 写 磁盘 ,但 并 不 是 所 有 的 write 操作 都 会 导致 内核 的 
邱 动 作 。 内 核 会 把 要 写 的 数据 暂时 存在 胃 冲 区 中 ,积累 到 一 定数 量 后 再 一 次 写 人 。 有 时 会 
导致 意外 情况 ,比如 罕 然 断 电 ,内 核 还 来 不 及 把 内 核 缓 种 区 中 的 数据 写 到 磁 副 上 ,这 些 重 新 
的 数据 就 会 丢失 。 

应 用 内 核 缓 冲 技 术 导 致 的 结果 : 

。 RARA LOG 

。 优化 磁盘 的 写 操作 

* 需 加 及 时 地 将 缓冲 数据 与 人 磁 绩 
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who 是 从 文件 读数 据 ,cp 从 一 个 文件 读数 据 写 人 到 另 一 个 文件 中 ,会 不 会 有 对 同一 个 文 
f REGE RS BH URL UG 2 


2.9.1 JEM: 做 了 些 什 么 


在 注销 过 程 中 ,系统 改变 了 文件 utmp 中 相应 的 登录 记录 ,从 whol 的 输出 可 以 看 出 文件 
utmp 中 还 包含 那些 末 被 使 用 的 终端 的 信息 ,通过 实验 来 香 这 个 过 程 : 

L AM PIT i OO BRP Unix 系统 中 。 

2. 运行 前 而 编写 的 whol 程序 来 察看 ump 中 与 你 的 登录 相关 的 两 条 记录 。 注 意 用 来 

3. 注销 其 中 一 

4. 运行 whol Me 上 述 两 条 记录 内 容 的 变化 。 

你 会 发 现 其 中 一 条 的 用 户 名 字段 跟 原 来 的 不 同 , 它 的 ut, time 字段 的 值 也 发 生 了 改变 。 
在 有 些 系 统 中 ,用 户 名 是 被 清空 的 。 还 请 关心 该 记录 还 有 哪些 改变 ”如 果 是 远程 登录 昵 ? 


2.9.2 注销 过 程 : 如 何 工 作 的 
这 其 实 很 简单 ,要 把 用 户 名 清空 , 按 以 下 步骤 做 就 行 了 


第 2 章 用 户 , 文 件 操作 与 联机 帮助 : 编写 who 命令 * 55 。 





1. 打开 文件 ut mp: 
2. M umpe 中 找到 包含 你 所 在 终端 的 登录 记录 ; 
3. 对 当前 记录 做 修改 ; 
， 4. 关闭 文件 ， 
下 面 详细 讨论 这 4 个 步 又 。 
l. 4677 © 4 utmp 
因为 负责 注销 的 程序 必须 对 文件 ump BEST Bc RSE Id OAS CB oS oR 
TE. Bi LEA M FFT FF ie T o PE: | 


fd = open(UTMP FILE, O_RDWR); 


2. A utmp 中 找到 包含 你 所 在 终端 的 登录 记录 
这 一 步 很 简单 ,在 while 循环 中 恋 取 一 条 utmp 记录 ,将 它 的 ut_line 字段 跟 你 的 终端 的 
名 字 做 比较 ,如 果 相 等 则 调用 修改 图 数 : 


while ( read(fd, rec, utmplen) -- utmplen) fx get next record «/ 
if ( stromp(rec.ut line, myline) == 0) /* what, my line? »/ 
revise entry(); /* remove my name x/ 


3， 对 当前 记录 做 修改 

负责 注销 的 程序 修改 当前 记录 ,再 把 它 写 问 到 文件 utmp +, Rik Ki, SH ut. type 
的 值 从 USER PROCESS 改 成 DEAD PROCESS, ,把 ut. time 字段 的 值 改 为 注销 时 间 , 也 就 
是 当前 时 间 , 有 些 版 本 会 把 用 户 名 和 远程 主机 字段 的 内 容 清 空 , 这 些 代 码 编 写 起 来 很 
容易 ， 

接 下 来 要 处 理 一 个 癌 手 的 问题 ;如何 把 修改 过 的 记 隶 写 回 文件 ? 可 以 用 write 吗 ? 不 
行 ,write 只 会 更 新 下 一 条 记录 ,而 不 是 当前 那 条 要 修改 的 记录 。 因 为 系统 每 次 打开 一 个 文件 
都 会 保存 一 个 指向 文件 当前 位 置 的 指针 , 当 读 和 写 操 作 完 成 时 ,指针 会 移 到 下 一 个 记录 位 置 ， 
这 个 指针 与 文件 描述 符 相 关联 。 在 这 种 情 咒 下 ,指针 是 指 阿 下 一 条 登录 记录 的 头 一 个 字 节 ， 
这 引出 了 一 个 重要 的 问题 : 

问题 : 在 文件 操作 中 ,如 和 何 改变 一 个 文件 的 当前 读 / 写 位 置 ? 

答题 : 使 用 系统 调用 lseek 。 

4, 关闭 文件 

JH] closeCEdD, 


2.9.3 改变 文件 的 当前 位 置 


前 面 讲 过 Unix 每 次 打开 一 个 文件 都 会 保存 一 个 指针 来 记录 文件 的 当前 位 置 , 如 图 2.8 
BIAS a 
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read JJ, =) 1) DE IX A fr 
定 长 度 的 数据 ,然后 移动 
当 菌 位 置 指 针 , 指 向 下 一 
^ A ie fr i NA 







XPF ILR - 


Sere atte 
文件 结尾 


图 2.8 内 核 为 每 个 打开 的 文件 保存 一 个 位 置 指针 


当 从 文件 读数 据 时 ,内 核 从 指针 所 标明 的 地 方 开始 , 读 取 指定 的 字 节 ,然后 移动 位 置 指 
St .指向 下 一 个 未 被 读 取 的 字 节 , 写 文 件 的 操作 也 是 类 似 的 ， 

指针 是 与 文件 描述 符 相 关联 的 ,而 不 是 与 文件 关联 ,所 以 如 果 两 个 程序 同时 打开 一 个 文 
件 ,这 时 会 有 两 个 指针 ,两 个 程序 对 文件 的 个 操 作 不 会 互相 干扰 。 

系统 调用 Iseek 可 以 改变 已 打开 文件 的 当前 位 置 ,lseek 的 用 法 如 下 ， 


Leek 

目标 使 指针 指向 文件 中 的 指定 位 轩 
头 文件 5 include —sys/type. h> 

2 include < unistd, he 
函数 原型 off t oldpos = lseektint fd, off t dist, int base) 
参数 fd 文件 描述 符 

dist 移动 的 距离 

base SEEK SET => 文件 的 开始 


SEEK CUR => 当前 位 置 
SEEK END => 文件 结尾 
J& [5] (i =] JA FY 8 X 
oldpos 指针 变化 前 的 和 位置 


一 一 Á- 


lseek 改变 文件 描述 符 所 关联 的 指针 的 位 置 ,新 的 你 置 由 dist 和 base 来 指定 ,base 是 基 
准 位 置 ,dist 是 从 基准 位 置 开 始 的 伪 移 量 ， 基准 位 置 可 以 是 文件 的 开始 (0) .当前 位 置 (1) 或 
文件 的 结尾 (2) n. 


lseék(fd, — (sizeof(struct utmp)), SEEK CUR); 
把 指针 往 前 移 一 个 uimp 结构 ,注意 偏 移 量 可 以 是 负 的 。 

lseek(fd, 10 » sizeof(struct utmp), SEEK SET); 

上 述 代码 把 指针 指 到 第 11 个 记录 的 开始 位 置 。 下 面 的 代码 ， 


lseek(fd, 0, SEEK END); 
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write(fd, "hello", strient"hello"2); 


使 指针 指 到 文件 的 末尾 , 接 下 来 写 一 个 字符 串 到 文件 中 。 
最 后 要 说 明 的 是 ,lseek(ftd, 0，SREEK_CUR) 返 回 指 针 所 指向 的 当前 位 置 


2.9.4 编写 终端 注销 的 代码 
利用 上 述 知 识 就 可 以 编写 一 个 函数 对 注销 的 的 用 户 修改 utmp 中 相应 的 记录 : 


* logout tty(char * line) 
* marks a utmp record as logged out 
* does not blank username or remote host 
* return — ] on error, 0 on success 
*/ 
int logout tty(char x line) 
| 


int fd: 

struct utmp rec; 

int ien = sizeof(struct utmp}- 

int retval = - 1; /* pessimism */ 
if tt fd = open(UTMP PILE DO RDWR)) == -1) /* open file x/ 


return - 1; 


/* search and replace */ 


while (read(fd, &rec, len} == len} 
if (strnemp(rec.ut line, line, sizeof(rec.ut line)) == Q) 
1 
rec.ut type = DEAD PROCESS, /* set type «/ 
if (time(krec.uL time !- -— 122 /* and time «/ 
if ( lseek(fd, - len, SEEK CUR) !* —1) /x back up «/ 
if (write(fd, &rec, len) == len) /* update */ 
retval - 0; /* success! »/ 
break: 


j 

/* close the file x/ 

if (close(fd) == - 1) 
retval = -1; 


return retval; 


t 


上 述 这 般 代 码 对 每 个 系统 调用 都 有 出 错 处 理 , 这 是 很 有 必要 的 ,因为 这 个 程序 需要 修改 
一 些 重要 的 系统 配置 文件 ,如 有 果 这 些 文件 的 内 容 遭 到 破坏 , 那 系 统 就 会 遇 到 麻烦 。 实 际 上 ， 
这 本 书 中 不 是 所 有 的 地 方 都 有 很 完善 的 出 错 处 理 , 这 并 不 表示 出 错 处 理 不 重要 ,而 是 为 了 使 
程序 更 加 清晰 易 懂 。 
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接 下 来 看 一 看 出 错 处 理 与 报告 。 


2. 10 ”处 理 系 统 调 用 中 的 错误 


如 果 open 无 法 打开 指定 的 文件 , 它 会 返回 一 1。 同 样 地 , 当 read 无 法 请 的 时 候 , 它 会 返 
回 一 1, 当 lseek 无 法 指定 指针 位 置 时 , 它 也 会 返回 一 1, 一 1 是 表示 在 系统 调用 中 出 了 些 问 题 ， 
调用 者 每 次 都 必须 检查 返回 值 ,一旦 检测 到 错误 ,必须 做 出 相应 的 处 理 。 

系统 调用 会 遇 到 哪些 错误 呢 ? 繁 个 系统 调用 都 有 自己 的 错误 集 , 以 open 为 例 , 如 果 要 打 
开 的 文件 不 存在 ,或 者 虽然 存在 ,但 没有 读 的 权限 ,或 者 已 经 打 升 的 文件 太 多 ,都 会 导致 系统 
报错 。 如 和 何 来 确定 发 生 了 哪 一 种 错误 呢 ? 

l. 确定 错误 的 种 类 : errno 

内 核 通过 伞 局 变量 errno 米 指 明 错 误 的 类 型 ,每 个 程序 都 可 以 访问 到 这 个 变量 。 

在 error(3) P9 ECL £8 HA errno. h> rp £i $6 te [C 0S A Fe B5 $8] ,以 下 是 一 些 例 子 ， 


{define  EPERM /* Operation not permitted */ 


# define  ENOENT /* No such file or directory */ 


ni 


H define EINTR /* InLerrupted system call */ 


l 
2 

# define ESRCH 3 /* No such process */ 
4 

# define EIQ 5 


/* I/O error x/ 


2. 不 同 的 错误 需要 不 同 的 处 理 
根据 以 上 出 出 的 错 庶 类 型 ,在 程序 中 进行 相应 的 处 理 : 


H include — errno, h> 
extern int errno; 
int sample() 


| 


int fd; 
fd = open("file", O_RDONLY> - 
if (fd == -1) 


i 
printf("Cannot open file; "); 
if ( errno == ENOENT ) 
pritnf('There is no such file. "}; 
else if ( errno == EINTR } 
printf( "Interrupted while opening file, "); 
else if ( errno == EACCESS ) 


printf("You do not have permission to open file. "); 


需要 根据 不 同 的 错误 类 型 做 不 同 的 错误 处 理 。 n RCELIT AT RU ARETE, OBZ 26 US 
示 重 新 输入 文件 名 ,如 果 已 经 打下 的 文件 太 多 , 那 就 关闭 一 些 不 需要 的 文件 ,这 种 情况 是 不 
需要 给 用 户 任 何 提示 的 .。 
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3. XR 4 idi E. perror(3) 


在 需要 显示 出 错误 信息 的 时 候 , 可 以 根据 不 同 的 错误 代码 打印 相应 的 字符 串 ， oa 
了 sample()? 就 是 这 样 做 的 ,另外 一 种 更 简 使 的 方法 是 用 perror(string) XP BR ES 
查找 错误 代码 ,在 标准 错误 输出 中 显示 出 相应 的 错误 信息 ,参数 string Forista 
述 性 信息 ， 


应 用 了 perror 的 sample; 


int sample(? 
i 
int fd; 
fd = open("file", O RDONLY) > 
if (fd == - 1) 
1 
perror( "Cannot open file”); 


return; 


当 有 和 错误 发 生 时 ,可 能 会 看 到 如 下 的 信息 : 


Cannot open file; No such file or directory 
Cannot open file: Interrupted system call 


显示 的 第 一 部 分 是 用 户 传 递 进去 的 描述 性 信息 ,第 二 部 分 是 根据 错 谋 代 码 查 到 的 错误 


小 结 


1， 主 要 内 容 


© who 命令 通过 该 系统 日 志 的 内 容 显 示 当 前 已 经 登录 的 用 户 。 
* Unix 系统 把 数据 存放 在 文件 中 ,可 以 通过 以 下 系统 调用 操作 文件 : 
open(filename, how) 
creat(filename, mode; 
read(fd, buffer, amt) 
write(fd, buffer, amt) 
lseek(fd, distance, base) 
close(td) 


。 UE CAE B ie / BBE GEL SE OC PETER FF ,文件 描述 符 表 示 文 件 和 进程 之 间 的 连接 。 
”每 次 系统 调用 都会 导致 用 户 模式 和 内 核 模式 的 切换 以 及 执行 内 核 代码 ,所 以 减少 程 
序 中 的 系统 调用 发 生 的 次 数 可 以 提 商 程序 的 运行 效率 。 


， 程序 可 以 通过 缓冲 技术 来 减少 系统 调用 的 次 数 , 仅 当 写 缓冲 区 满 或 读 缓冲 区 空 时 才 
调用 内 核 服务 ， 


e Ò » 
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。 Unix 内 核 可 以 通过 内 核 缓 冲 来 减少 访问 磁盘 10O 的 次 数 ，。 


Unix 中 时 间 的 处 理 方式 是 记录 从 某 一 个 时 间 开 始 经 过 的 秒 数 。 


- 当 系 统 调用 出 错时 会 把 全 局 变量 errno 的 值 设 为 相应 的 铺 误 代 码 , 然 后 返回 一 1, 竹 
序 可 以 通过 检查 errno 来 确定 错误 的 类 型 ,并 采取 相应 的 措施 . 

。 这 一 章 涉及 的 知识 在 系统 中 都 可 以 找到 ,联机 帮助 中 有 命令 的 说 明 , 有 些 还 会 涉及 全 
令 的 实现 , 头 文 件 中 有 结构 和 系统 常量 的 定义 ,还 有 小 数 原型 的 说 明 。 


a. 
2.1 


m 


2. 


2,4 


2.6 


习题 
在 Unix 中 有 一 个 w 命令 ,这 个 命令 与 wh 有 关 , 运 行 这 个 命令 ,并 阅读 它 的 联机 


帮助 , 找 出 它 提供 了 哪些 who 没有 提供 的 信息 ?其 中 有 了 哪些 信息 来 和 月 utmp 这 个 
文件 ? 这 些 信 息 各 是 什么 洛 义 ?其 他 信 息 来 日 哪 里 ? 


用 户 登 录 的 时 候 , 登 录 信 息 会 被 记录 在 utmp 文件 中 ,在 注销 的 时 候 , 文件 中 相应 
的 记录 会 被 删除 。 如 果 用 户 正在 使 用 系统 的 时 候 , 系 统 突然 角 江 ,很 明显 ,这 时 候 
utmp 文件 的 内 容 会 有 问题 ,在 系统 重新 启动 的 时 候 , 会 对 uunp fif] A 4b ue? 
系统 会 不 会 重新 为 每 一 条 可 用 终端 建立 记录 ? 查阅 相关 的 联 和 机 帮助 和 头 文 件 , 以 
及 启动 脚本 , 米 找 出 上 述 问 题 的 答案 ,可 以 在 自己 的 机 器 上 做 实验 来 验证 自己 的 


做 个 宝 验 ,把 一 个 文件 复制 到 /devytty:，cpl cpl. c /dev/tty, BATS ml BS EB br x 
件 是 一 个 终端 。 对 终端 的 读 写 操作 与 对 一 个 普通 文件 进行 读 写 是 一 样 的 。 接 下 
来 做 实验 ,从 终端 读 , 这 时 会 从 键盘 读 宇 符 , 然 后 写 人 到 文件 中 ,输入 是 以 回 车 十 
<Ctrl-D>> 作 为 结束 标志 以 


标准 C AU fopen.getc.fclose.fgets 的 实现 都 包含 内 核 级 的 缓冲 .它们 用 到 了 
一 个 结构 FILE ,并 以 此 为 基础 构造 了 类 似 utmplib 的 中 间 层 ,在 头 文件 中 找到 结 
FY FILE 的 成 员 措 述 , 将 其 与 utmplib. e 中 的 变量 做 比较 。 


择 么 来 确定 数据 已 经 被 写 到 磁 提 上 (不 是 被 缓 冲 )? 采用 组 部 技术 时 ,内 核 会 把 要 
写 人 磁盘 的 数据 放 在 缓冲 区 ,然后 在 它 认为 合适 的 时 候 写 人 磁盘 。 阅 读 相 应 的 联 
机 帮助 ,找到 能 够 确定 地 把 数据 写 人 磁盘 的 方法 。 


Unix 多 圭一 个 文件 同时 币 多 个 进程 打开 ,也 允许 一 个 进程 同时 打开 好 几 个 文件 ， 
伐 多 次 打开 文件 的 实验 : 

(1) 以 读 的 方式 打开 文件 

(2) 以 与 的 方式 打开 文件 

(3) 再 次 以 读 的 方式 打开 文件 

这 时 有 3 个 文件 描述 符 , 接 下 来 : 

(4) 从 第 一 个 文件 描述 符 5 以 下 简称 fd} 中 读 20 字 节 ,显示 读 到 的 内 容 。 

(55 MABLA fd SA“ testing 123+”, 

(6) ASS = id BEM 20 FT. RRR AWAR. 


d. f 
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联机 帮助 man 中 可 以 查 到 关于 命令 .系统 调用 .系统 设备 等 帮助 信息 ,如 何 才能 了 
解 man 的 使 用 方法 ? 在 你 的 系统 中 ,man 分 为 几 个 小 节 ? 它们 分 别 是 什么 ? 


2.8 ”本章 提 到 文件 ump 中 还 包含 了 一 些 记录 ,它们 与 已 登 录用 户 的 信息 无 关 ,那么 它 


2.9 


们 存放 的 是 什么 ” 各 代表 什么 会 义 ? 
lseek 可 以 将 文件 指针 移动 文件 的 末尾 以 后 ,如 


lseek(fd, 100, SEEK END) 

TH ep | X BECK RE BEES 100 个 字 节 的 地 方 。 如 打从 文件 末尾 以 后 100 PF 
的 地 方 开始 读 会 田 现 和信 么 情况 ?如 果 从 文件 末尾 以 后 100 个 字 市 的 地 方 开始 写 会 
出 现 什 么 情况 ? 从 100 字 节 增加 到 20000 F PEE A hello E 8 2:81 r2 AR, 
用 1s -1 米 检查 文件 的 长 度 , 上 髓 用 ls ~s WA. 


3. 编程 练习 


2. 10 


2. 14 


M who 的 联机 帮助 中 可 以 知道 who am i 也 是 可 以 接受 的 形式 ;同样 还 有 
whoami , tt who2. c. (fit X Rp who ami 的 形式 。 阅读 whoami 的 联机 帮助 ,看 
它 与 who 有 什么 不 同 ,编程 实现 whoami, 


使 用 标准 cp 命令 时 , 当 原 文件 和 虽 标 文件 相同 时 ,会 有 什么 结果 ? 修改 who. c 
使 之 能 够 处 理 这 种 情况 。 


在 utmplib. c PIJL KA EA T A utmp XCPEB See PHX eg X ,每 
次 返回 一 个 utmp 记录 ,有 时 返回 的 记录 中 可 能 不 包含 任何 有 用 的 信息 ,修改 
uttmpjib, c, 使 每 次 返回 的 部 是 有 用 的 信息 。 这 样 做 会 影响 到 who3. c 其 他 部 分 
的 代码 吗 ? 为 什么 ? 


eR BY logout tty O f£ Hj tseek 往 前 移动 指针 ,以 便 重 写 当 前 记录 ,注意 在 这 个 eR BY 
HRA HEELS sp se AR «un HR [ir FR E np ap LUE RUOTE ae TT 

(1) 如果 在 logout, tty O PAS] utmplib. e 中 的 函数 会 产生 什么 问题 ? 

(2) 在 utmplib. c 中 增加 一 个 肾 数 ， 


utmp seek(record offset, base) 
改变 当前 指针 的 位 置 , record offset RE E H ay hiit E, hase 可 以 是 SEEK 
SET,CEEK, CUR 或 SEEK END, H & fm B Eb AII 1, 表 示 要 移动 sizeof 
(struct utmp) AY. 
(3) fiit logout. tty O 以 便 能 够 使 用 utmplib. c PAY eg £r. 


whol 可 以 显示 出 utmp 中 的 每 条 记录 ,虽然 这 不 是 原来 想 要 的 功能 ,但 却 提供 了 
一 个 工具 ,以 使 能 够 检查 utmp 文件 内 容 的 变化 。utimp 记录 中 的 at type 字段 很 
有 用, 修改 whol 使 之 能 够 显示 utmp 记录 的 所 有 字段 ,进一步 修改 使 whol 能 够 
通过 参数 指定 划 读 取 的 文件 ,这 样 就 可 以 用 whol 来 检查 文件 wimp HAR. 


标准 的 cp 会 自动 覆盖 已 经 存在 的 文件 ,而 不 给 出 任何 担 示 ,如 志 经 存在 了 一 个 文 


TT Unix/Linux 编程 实践 教程 


^ La —a4* 
———— 9 





ft. filec2, 又 输入 : 

5 cp filel file2 
会 覆盖 file2 MAA. MER cp 有 一 个 参数 -i 可 以 在 覆盖 前 给 出 提示 ,得 到 确认 
HS. Bk cpl. 使 之 也 具有 上 述 特性 。 


4， 项 目 
根据 本 章 所 学 的 内 容 , 编写 以 下 的 Unix RU; 
ac, last, cat, head, tail, od, dd 

0. 最 后 一 个 问题 : tal 命令 

这 一 章 通 过 分 析 几 个 命令 已 经 学 到 了 很 多 知识 ,最 后 还 有 一 个 命令 tail, 请 读者 来 分 析 。 

jseek 命令 可 以 移动 指针 ,lseek(fd; 0, SEEK_END) 可 以 使 指针 移 到 文件 的 末尾 ， 

tail 命令 显示 出 文件 末尾 指定 行 数 的 内 容 , 所 以 ,tail 必须 能 够 找到 文件 中 一 个 指定 的 地 
方 , 注 意 不 是 末尾 ， | 

AMMAKE? FP oh Ao A ee AR A noH OR EE eR, PR AL BE 
看 tall 都 有 哪些 选项 , 想 想 它 们 怎么 实现 。 

本 书 的 网 站 上 有 商 个 版 本 的 tail 的 源 代码 ,其 中 一 个 是 GNU 版 本 的 ,另外 一 个 是 BSD 
版 本 的 ,它们 用 了 完全 不 同 的 思路 , 却 玫 实现 得 很 好 ,最 好 先 自己 写 ,然后 再 参考 它们 的 实现 。 
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概念 与 技巧 

。 有 目录 是 文件 的 列表 

”如 何 读 取 目 录 的 内 容 

文件 类 型 以 及 如 何 知道 文件 的 类 型 
© 文件 属性 以 及 如 何 知 道 文 件 的 属性 
， ARF S f B3 BS (d FH 

^ 用户 与 组 ID 及 passwd 数据 库 
相关 系统 调用 与 范 数 

* opendir,readdir,closedir .seekdir 

e stat 

。 chmod,chown,utime 

* rename 

相关 命令 


* js 
3.1 JP 绍 


书 经 介绍 了 如 何 读 / 写 文件 内 容 的 方法 。 除 了 内 容 之 外 ,文件 还 有 很 多 属性 ,比如 文件 
所 有 者 、 最 后 修改 时 间 ,文件 大 小 .类 型 等 。 文 件 名 在 目录 中 列 出 ,正如 电话 号 码 穗 中 列 有 人 
名 一 样 如何 恋歌 文件 名 利文 件 的 属性 呢 ? 

Is 说 令 可 以 列 出 目录 中 所 有 文件 的 名 字 , 以 及 这 些 文件 的 其 他 信息 。 本 意 通 过 分 析 ds 
命令 来 学 习 目 录 和 文件 的 类 型 与 属性 。 


3.2 问题 1: ls 命令 能 做 什么 


3.2.1 1 可 以 列 出 文件 名 和 文件 的 属性 
在 命令 行 输入 Is: 





«64% Unix/Linux REX RAE 
S ls 
Makefile docs  ls2.c s. tar statdemo.c taill.c 
chapo3 1s81,c old sre  stati.c  taill 
$ 


ls 的 默认 动作 是 找 出 当前 目录 中 所 有 文件 的 文件 名 , 按 字 典 序 排序 后 输出 。 有 些 版 本 的 
ls 默认 会 分 栏 输出 ,有 些 需 要 参数 -C 才 这 样 做 。 
ls 还 能 显示 其 他 的 信息 ,如 果 加 上 -1 选项 ,ls 会 列 出 每 个 文件 的 详细 信息 ,也 叫 ls 的 长 


格式 : 
S iş -1 
total 104 
-rw-rw-r-— 2 bruce users 345 Jul 29 11-05 Makefile 
-r4-rw-r.— l bruce users 27521 Aug 1 12:14 chapd3 
drwxrwxr-x 2 bruce users 1024 Aug 1 12:15 docs 
-rw-r--r-—- 1] bruce users 723 Feb 3 1998 lsl.c 
-rYw-r--r-— 1 bruce users 3045 Feb 15 03-51 1s2.c 
drwxrwxr-x 2 bruce users 1024 Aug 1 12:14 old src 
—rw-xw-r-- Í bruce users 30720 Aug 1 12:05 s.tar 
-rw-r--r-- 1 bruce support 946 Feb 18 17:15 statl.c 
-rw-r--r-- 1 bruce support 191 Feb 9 19598 statdemo.c 
—rwxrwxr-x 1 ‘bruce users 37351 Aug 1 12:13 taill 
-rw-r--r-- 1 bruce users 1416 Aug 1 12:05 taili.c 


$ 


每 一 行 代表 一 个 文件 和 它 的 多 个 属性 。 
.2 列 出 指定 目录 或 文件 的 信息 
一 个 Unix 系统 中 会 让 很 多 的 目录 ,每 个 目录 中 又 会 有 很 多 文件 。 如 果 要 列 出 一 个 


非 当 前 目录 的 内 容 或 者 是 一 个 特定 文件 的 信忠, 则 需要 在 参数 中 给 出 目录 名 或 文件 名 ，。 


用 is 21 8H TRE ELSE RO E E 
例 T 说 — H 


ls {tmp 51 t /tmp 目录 中 各 文件 的 文件 名 
ls -1 docs TH) docs 目录 中 各 文件 的 属性 
is -1.. /Makeiile Bam iE.. (Makefile 的 属性 

Is *.c 显示 与 *.c 匹 本 的 文件 


好 打 参 数 是 目录 ,is 列 出 目录 的 内 容 , 如 果 参 数 是 文件 ,1s 列 出 文件 名 和 属性 。 所 给 的 命 


令 行 选项 在 很 大 程度 上 决定 了 ls 的 输出 内 容 。 
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3.2.3 ”经 常用 到 的 命令 行 选项 


* *$ 说 明 


ls -a 列 出 的 内 容 包 含 以 “. "开头 的 文件 
Is - lu 显示 最 后 访问 时 间 

ls -s 显示 以 块 为 单位 的 文件 天 小 

Is -t 和 输出 时 按时 间 排 序 

ls -F Tr LFR 


如 果 对 Unix 不 是 很 熟悉 ,那么 可 能 需要 解释 一 下 -a 这 个 选项 ,得 Unix 中 ,ls 一般 不 会 
列 出 以 “, “开始 的 文件 ,所 以 可 以 把 这 样 的 文件 看 作 是 隐藏 文件 。ls 加 上 了 -a 以 后 ,过 到 这 
样 的 文件 也 必须 把 它 列 出 来 。 对 操作 系统 (例如 内 核 ) 而 言 ,文件 名 前 面 的 “. "没有 任何 特殊 
HAX ERX Is 的 使 用 者 有 意义 。 

某 些 应 用 程序 的 配置 文件 是 位 于 用 户 的 主 目录 下 以 ", "开始 的 某 个 文件 ,这 是 由 习惯 形 


成 的 ,因为 在 大 多 数 情 况 下 可 以 将 它们 隐藏 。 但 是 需要 时 可 以 直接 被 打开 编辑 ,不 需要 任何 
特殊 的 操作 . 


3.2.4 问题 的 答案 


通过 实验 和 联机 帮助 可 以 知道 ls 做 了 以 下 两 件 事 : 

* 列 出 目录 的 内 容 

”显示 文件 的 信息 

注意 ls 对 文件 和 目录 所 做 的 操作 是 不 同 的 。ls 能 判定 参数 指定 的 是 文件 还 是 目录 。 这 
ini RA? 如 果 要 自己 写 一 个 ls, 以 下 三 点 是 带 要 掌握 的 ， 

*。 如何 列 出 目录 的 内 容 

。 如 何 读 取 并 显示 文件 的 属性 

© 给 出 一 个 名 字 , 如 何 能 够 判断 出 它 是 目录 还 是 文件 


3.3 文 fF Hl 


在 开始 之 前 , 先 来 看 看 Unix 是 如 何 组 织 磁盘 上 的 文件 的 。 
磁盘 上 的 文件 和 目录 被 组 成 一 避 旧 录 树 ,每 个 节点 都 是 自 录 或 文件 ,如 图 3. 1 所 示 。 
m- aE 










EA | LE 
ppp 
Pia SE: 


« B6 » | Unix/Linux 编程 实践 教程 


图 3. 1 中 的 大 方 框 表 示 目 录 , 大 方 框 内 的 小 方 框 表示 文件 ,目录 之 同 的 连 线 表 示 月 录 之 
IR] 9) 2H £4 25 Fe 

在 Unix 系统 中 ,每 个 文件 都 位 于 某 个 目录 中 ,在 伪 辑 上 是 设 有 驳 动 器 或 着 的 ,当然 在 物 
理 上 一 个 系统 可 以 有 多 个 驱动 器 或 分 区 ,每 个 驱动 器 上 都 可 以 有 分 区 ,位 于 不 同 驱动 器 和 分 
区 上 的 目录 通过 文件 树 无 缝 地 连接 在 一 起 ,甚至 软盘 .光盘 这 些 移动 存储 介质 也 被 挂 到 文件 
树 的 某 一 个 子 目录 来 处 理 。 

这 些 使 ls 的 实现 极为 简单 ,只 需 考虑 文件 和 目录 两 种 情况 i A 25 T8 BR SU S8 EX T DX. 


3.4 问题 2: ls 是 如 何 工作 的 


ls 产生 一 个 文件 名 的 列表 , 它 大 臻 是 这 样 工 作 的 ， 


open directory 
+-">read entry - end of dir? -+ 
_ display file info | 


close directory 一 + 


上 述 逻 辑 与 who 的 十 分 相似 ,主要 的 区 别 是 who 从 文件 中 读数 据 , 而 ls 从 目录 中 读数 
据 , 读 目录 与 读 文 件 区 别 大 吗 ? 目录 到 底 是 什么 呢 ? 


3.4.1 什么 是 目录 


先 来 着 一 看 什么 是 目录 。 目 录 是 一 种 特殊 的 文件 , 它 的 内 容 是 文件 和 目录 的 名 字 。 从 
某 种 程度 上 说 ,目录 文件 与 上 一 章 讲 的 utmp 文件 很 类 似 。 它 们 都 包含 很 多 记 录 , 每 个 记录 
的 格式 出 统一 的 标准 定义 。 每 条 闪 录 的 内 容 代 表 一 个 文件 或 月 录 。 

与 普通 文件 不 同 的 是 ,目录 文件 永远 不 会 空 ,每 个 日 录 都 至少 包含 两 个 特 跌 的 项 一 一 
SURI". ”其 中 “表示 当前 目录 .去 示 上 一 级 日 录 。 


3.4.2 是 否 可 以 用 open.read 和 close 来 操作 目录 
通过 以 下 实验 来 看 日 录 文 件 的 内 容 : 


$ cat / 
as’.a'asa,.a'bw. tagsb'ci 
quota. userc'! 
quota.group'esbetce' 'sbtmp' "sbdev" sbmnt ' wcsbin '2 
sbopt2 
H 
sbusrb 
19 
sbvar9 


(many lines of hard- to- read data omitted) 


5 more /tmp 





/tmp is a directory 


$ od -c /dev 
QOGCDOD 360 
0000020 091 
0000040 002 
OO000060 M 
0000100 362 
0000120 362 


0000140 k 


G000160 364 
0800200 364 
0060220 k 
0000240 366 


从 以 上 的 例子 中 可 以 发 现 3 点 ,第 一 ,cat 和 od 可 以 打开 目录 。 因 为 cat 和 od 使 用 的 是 
标准 的 文件 操作 系统 调用 ,所 以 目录 可 以 被 open.read.close 打开 ;第 二 ,more 可 以 区 分 出 文 
件 和 上 录 , 它 拒绝 对 目录 进行 操作 ,有 些 版 本 的 cat 和 more 一 样 拒绝 显示 目录 内 容 ; 第 二 ,从 
以 上 列 出 的 目录 内 容 可 以 知道 ,目录 内 不 是 无 格式 的 文本 而 是 包含 一 定 的 数据 结构 。 

实际 上 用 open. read .close 这 些 系 统 调用 来 操作 是 录 并 不 是 很 好 的 方法 ,Unix 支持 多 种 
的 目录 类 型 ,有 Apple HFS.1809660, VFAT,NFS 等 , 如果 用 read 来 读 : 那 么 需要 了 解 这 些 


001 
200 


\0 


001 
001 


001 
O01 
m 


001 


\0 
AQ 
40 

K 
40 
Mt 

e 
A0 
A0 

e 


\0 


\0 
\0 
\0 

E 
\0 
\0 
\0 
\0 


AQ 


第 3 章 目录 与 文件 属性 : 编写 ]s 


024 
002 
001 
D 
030 
001 
40 
030 
001 
AQ 
024 


不 同类 型 月 录 各 自 的 结构 细节 。 
3.4.3 如何 读 目录 的 内 容 
什么 聊 数 可 以 污 目 录 呢 ?在 联机 帮助 中 根据 关键 字 direct KERER.: 


5 man - k direct 


\0 
XO 
200 
E 
XO 
200 
XQ 
X0 
200 
\0 
\0 


O01 
40 
40 

V 

004 
A0 
AD 
\a 
A0 
40 

003 


40 
40 
\0 
\0 
A0 
40 
AQ 
40 
A0 
A0 
\0 


024 
361 
J61 


363 
363 

k 
365 
365 


m 


A0 
A0 
001 
001 
1 
001 
00l 
b 
001 
001 


e 


\0 
002 
\0 
Y, 
QD 
\0 
\0 
\0 
A0 


I 


40 
AD 
40 
AD 

g 
40 
40 

n 
40 
A0 
AD 


350 


030 
001 
A0 
030 
001 
1 
030 
O01 


466 


001 “0 
s X0 
‘oO \a 
200 “0 
\O 4D 
X0 004 
200 0 
o g 
X0 004 
200 “0 
DO1 “0 


我 所 用 的 系统 返回 了 81 条 主题 ,用 grep 滤 出 那些 包含 read 的 主题 ， 


$ man -k direct grep read 


DxmHelpSystemDisplay (3X) - Displays a topic or directory of the help file in Bookreader. 


X0 
XO 
X0 
XO 
\9 
\0 
AO 
AD 
V0 
XO 
\0 
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opendir, readdir, readdir r, telldir, seekdir, rewinddir, closedir(3) -- Performs operations 


on directories 


5 


其 中 的 readdir ILA BM 3E ELI REL SE B. 


^ man 3 readdir 


opendirt3) 


NAME 


opendir(3) 


opendir, readdir, readdir r, telldir, seekdir, rewinddir, closedir - 


Performs operations on directories 
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LIBRARY 


Standard C Library (libe. a) 
SYNOPSIS 


B include <sys/types.h> 
4 include <dirent. h> 


DIR x opendir(const char * dir name); 

struct dirent » readdir(DIR x dir pointer); 

int readdir r(DIR a dir pointer, struct dirent » entry, 
struct dirent »*~* result); 

long telldir(DIR + dir, pointer); 

void seekdir(DIR » dir pointer, long location ); 

void rewinddir(DIR * dir pointer); 

int closedir(DIR 4 dir pointer); 

[gore] (11%) 


通过 联机 帮助 可 以 知道 ,从 目录 读数 据 与 从 文件 读数 据 是 类 似 的 ,opendir 打开 一 个 县 
3& ,readdir 返回 目录 中 的 当前 项 ,closedir 关闭 一 个 目录 ,seekdir telldir, rewinddir 5 lseek 
的 功能 类 位, 如 图 3. 2 所 示 。 


struct direnl 
opendir(char » ) 


creates à connecnon, 


| | BRIGG EH: - 
returns a DIR a Pipe a tease A 
EPA i e Bau 
fog ye MZ T 


readdir (DIR =) 
reads next records, 
returns a pointer it ee... Lee SaaS ee iin — 


to a atruct dirent 


closedir (DIR =) 


closes 8 connection 





上 — 


aediles dn... | 


3.2 从 上 且 录 中 污 到 一 项 


目录 是 文件 约 列表 ,更 确切 地 说 ,是 记录 的 序列 .每 条 记录 对 应 一 个 文件 或 子 目 录 。 通 
过 readdir 来 读 到 目录 中 的 记录 ,readdir 返回 一 个 指向 目录 的 当前 记录 的 指针 ,记录 的 类 型 
是 struct dirent ,这 个 结构 定义 在 /usr/inctude/direnr. 中 ,联机 帮助 中 也 可 以 查 到 。 

在 SunOS 中 关于 它 的 帮助 信息 如 下 : 


File Formats dirent(4) 
NAME 


dirent - file system independent directory entry 


一 一- cr — T PM e 


PIE 目录 与 文件 属性 ,编写 ls a Q o 





SYNOPSIS 
# include < dirent. h> 


DESCRIPTION 
Different file system types may have different directory entries. The dirent structure 
defines a file system independent directory entry, which contains information common Lo 
directory entries in different file system types. A set of these structures is returned by 


the getdents(2) system call. 
The dirent structure is def ined- 


struct dirent | 


ino t d ino; 

off t d aff; 
unsigned short d reclen; 
char d namne[ i1]; 


rg 


dirent 结构 中 成 员 d. name 用 于 存放 文件 和 名。 注意 在 此 系统 中 d name REX HRA 
^F ZG AY 2B ,这 如 和 何 能 做 到 呢 9 因为 一 个 字符 的 空间 只 能 存放 字符 串 的 结束 符 . 


3.5 HIE 3: 如 何 编写 Is 


main() 
opendir 
while ( readdir ) 
print d name 


closedir 


Std TR AS F: 


f» lsl.c 
x* purpose list contents of directory or directories 
** action if no args, use. else list files in args 
xx, 

H include < stdio. h> 

# include < sys/ types. hn > 

# include < dirent. h> 


void do ls(char |]); 


main(int ac, char » av[ ]) 





Q PAE: 关于 d name 的 定义 ,UNIX 的 省 个 版 本 稍 有 不 同 ,在 Linux 中 是 char d. name [NAME MAX-« 1]. 
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if (ac == l1) 
do ls( "." kg 
else 
while ( —- ac 51 
printf(" $ s;An", x +tav }; 


do ls( * av); 


void do ls( char dirname[ ` ) 
fx 
* list files in directory called dirname 
2 / 
| 
DIR * dir ptr; /* the directory s/ 


Struct dirent x direntp; /* each entry */ 


i£ { { dir ptr = opendir( dirname ) ) == NULL ) 
fprintf(stderr,"1sl; cannot open 上 s\n", dirname), 
else 
| 
while ( ( direntp = readdir( dir ptr ) ) | = NULL» 
printf(" $& s\n", direntp ——d name ); 


closedir(dir ptr); 


将 上 述 代码 编译 运行 ,并 将 输出 与 标准 的 1s 的 输出 做 比较 ， 


5 cc -olsi 191.c 
$ 上 gd 


S. tar 
taill 
Makefile 
Tale 
1s2.c 
chap03 
old src 
docs 

1s1 
statl.c 


statdemo.c 
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taill.c 


S ls 

Makefile docs lsil.c 
chapo3 Isl 1s2.c  s.tar 
$ 


old src Statl.c taill 


statdemo.c taill.c 


还 能 做 什么 


看 来 ls 的 第 一 个 版 本 还 不 错 , 但 是 以 下 功能 还 需要 加 进去 。 

(12 排序 

ls] 的 输出 没有 经 过 排序 ,解决 办 法 ; 把 所 有 的 文件 名 读 人 一 个 数组 ,用 asort 图 数 把 数 
组 排序 。 

(2) 分 栏 

标准 的 la 的 输出 是 分 栏 排 列 的 ,有 些 以 行 排 序 输出 ,有 些 以 列 排 序 和 输出 。 解 关东 法 : A 
把 文件 名 读 人 数组 ,然后 计算 出 列 的 宽度 和 行 数 . 

(2x “2 文件 

Is] 列 出 了 “. ”文件 ,而 标准 的 is 只 有 在 给 出 -a 选 项 时 才 会 列 出 这 些 文件 。 解 次 办 法 : 
使 1s1 能 够 接收 选项 -a, 并 在 没有 a 的 时 候 不 显示 隐藏 文件 。 

(4) 选项 -] 

如 果 选 项 里 有 ~], 标 准 的 ls 会 列 出 文件 的 详细 信息 ,而 isi 不 会 。 解 决 办 法 : 要 解决 这 
个 间 题 不 是 太 容 易 , 因 为 dirent ARRA de DEBT RENE X ITA MAAS. 
如 果 文 件 的 这 些 信 息 不 是 存储 在 目录 中 ,那么 它们 会 存 鱼 在 什么 好 方 呢 ? 


编 5 is -i 


ls 要 做 两 件 事 情 , 一 是 列 出 目录 的 内 容 , 二 是 显示 文件 的 详细 信息 ,这 实际 上 是 两 件 不 同 
的 工作 ,目录 包 会 文件 名 ,文件 信息 则 需要 从 另外 的 途径 蓝 得 , 接 下 来 从 3 个 问题 人 手 , 来 解 
决 文件 信息 显示 的 问题 。 


问题 1 . ls -能 做 些 什 么 
先 来 看 ls 一 | 的 输出 : 


3. 6 


3, 6.1 


s ls -1 

total 108 

-rWw-rw-r-- 2 bruce users 345 dul 29 11.05 Makefile 
-rw-rw-r-- 1 bruce Users 27521 Aug 1 12;14  chap63 
drwxrwxr-x 2 bruce Users 1024 Aug 1 .12;15 docs 
-rw-r--r-- 1 bruce Users 723 Feb 9 19988  lsl.c 
-rWw-r--r-- 1 bruce Users 3045 Feb 15 03:51 ls2.¢ 
drwxrwxr-x 2 bruce Users 1024 Aug 1 312;14 old src 


a 77 € 


má 一 一 一 


-FW-rW-r-- bruce 


PE X lus bruce 


—YWXIWXE-X bruce 


bruce 


l 

] 
Pu PE ag are 1 bruce 

1 

e pcc 1 

i 


a a ce a 


$ 


AA ETE 
Risk (made) 


oer $F BT (links) 


文件 所 有 者 (owner) 
£H (group? 
htCsize? 


最 后 修改 上 时间 
(last - modified) 


X PE 4 Game) 


cse215 cscie215 574 Feb 


b - o —M— ————— ———— — — ee T 
-_—_.b- 
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Users 30720 Aug i 12:05 s.tar 

support 946 Feb 18 17:15  statl.c 

support 191 Feb a 1998 statdemo.c 

Users 37351 Aug 1 12:13 taill 

Users 1416 Aug 1 12.05 taill.c 
9 


1998  writable.c 


每 行 的 第 :个 字符 表示 文件 类 型 .“- ”代表 普通 文件 ，d ”代表 目 
录 , 其 他 的 类 型 以 后 还 会 遇 到 。 

接 下 来 的 3 个 字符 表示 文件 访问 权限 ,分 为 读 权 限 、 写 权限 和 执行 
权限 ,又 分 别针 对 3 种 对 象 ; 用 户 , 同 组 用 户 和 其 他 用 户 ,所 以 一 共 
需要 9 位 来 表示 。 从 前 面 的 1s -l 的 输出 中 可 以 看 出 ,所 有 的 文件 
和 日 录 对 所 有 用 户 都 是 可 读 的 ,只 有 文件 的 所 有 者 才能 对 文件 进 
行 收 改 , 所 有 用 户 都 有 taill 的 执行 权限 ， 

链接 数 指 的 是 该 文件 镀 引 用 的 次 煞 , 这 方面 的 内 容 将 在 下 一 章 
介绍 。 

指出 文件 所 有 者 的 用 户 名 ， 

指 文件 所 有 者 上 所 在 的 组 。 有 些 版 本 的 Is BAS. 

第 五 州 显示 文件 的 大 小 。 在 前 和 面 的 ls -1 的 输出 中 ,所 有 的 目录 大 
小 相等 ,都 是 1024 字 节 ,因为 上 且 录 所 占 空间 的 分 配 是 以 块 人 block) 
为 单位 的 ,每 个 块 512 字 节 ,所 以 目录 的 大 小 经 常 是 相等 的 。 如 果 
是 一 般 的 文件 ,size 列 则 显示 了 文件 中 数据 的 实际 字 节 数 。 

文件 的 最 后 修改 时 间 。 如 果 是 较 新 的 文件 ,会 列 出 月 .日 和 时 刻 ， 
对 于 较 老 的 文件 ,只 能 列 出 月 B TI. 

文件 名 


3.6.2 问题 2: ls -1 是 如 何 工作 的 
如 何 得 到 文件 的 信息 呢 ? 在 键盘 上 输入 : 


S man -k file | grep = 


i information 


在 有 些 系 统 上 可 以 得 到 有 用 的 参考 信息 ,有 些 却 不 可 以 ,因为 这 些 系 统 使 用 的 术语 是 
文件 状态 人 file status) 而 不 是 交 忻 信息 (file information) 8 3$ X fg TE (file properties) 来 代 
表 文 件 的 各 种 人 信息。 提取 文件 状态 的 系统 调用 是 stati 


3.6.3 用 stat 得 到 文件 信息 
图 3.3 显示 了 stat 的 工作 方式 。 
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stal( name, pur) 


Xf name 所 指定 的 文件 信 | 
息 讯 人 一 个 结构 中 . | 


stuct stat 
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fg 3.3 用 sa 该 双 文 件 的 属性 


磁盘 上 的 文件 有 很 多 属性 ,如 文件 大 小 .文件 所 有 者 的 ID 等 。 如 果 需 要 得 到 文件 属性 ， 
进程 可 以 定义 一 个 结构 struct stat ,然后 调用 stat ,告诉 内 核 把 文件 属性 存放 到 这 个 结 和 购 中 ， 


Stal 

目标 得 到 文件 的 属性 i 
i xe k include < sys/stat. h> 
di Et im ay int resul = stat(char # fname, struct stat * buíp) 
参数 (name ”文件 名 

bufp fH 15] buffer 的 指针 | 
返回 值 =l 过 a 到 错误 

0 成 功 返 回 


stat 把 文件 fname 的 信息 复制 到 指针 bufp 所 指 的 结构 中 。 下 面 的 代码 展示 了 如 何 用 
stat 来 得 到 文件 的 大 小 : 


/* fxXlesize.c - prints size of passwd file «/ 


H include <stdio. h> 
ER include —sys/stat.h— 


int main() 

{ 
struct stat infobuf; /* place to store info «/ 
if ( stat( "/etc/passwd", &infobuf) == -1) /* get info »/ 


perror("/etc/passwd"); 
else 
printf(" The size of /etc/passwd is %d\n", 
infobuf.st size ); 


stat 把 文件 的 信息 复制 到 结构 infobul 中 ,程序 从 成 员 变量 sr_size 中 该 到 文件 大 小 。 
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3.6.4 stat 提供 的 其 他 信息 
stat 的 联机 帮助 和 天 文件 /usrrincliudeysysy/stat.h 描述 了 struct stat 的 成 员 变 量 : 


st mode SC AES AO FE BT ASR 
st_uid 用 户 所 有 者 的 ID 

st gid 所 属 组 的 ID 

st size 所 占 的 字 节 数 

st niink X re 

st mtime 文件 最 后 修改 时 间 

st atime 交 件 最 后 访问 时 间 

st ctime St fr RE Fe Js ET TH 


stat 结构 中 其 他 未 被 ls -1 用 到 的 成 员 变 量 未 在 这 里 列 出 。 下面 的 例子 fileinfo. c 得 到 
以 上 这 些 属 性 ,并 显示 出 来 。 


/* Fileinfe.c - use stat} to obtain and print file properties 
x - some members are just numbers... 

x / 

# include < stdio. h> 

1 include <_sys/types. h > 

村 include <_sys/stat. h ~ 


int main(int ac, char x av] j} 


i 
struct stat info; ix buffer for file info x/ 
if (ac771) 
if C stat(av[1], &info) ! = -1)4 
show stat info( av[1!, &info ); 
return Q: 
| 
else 
perror(avl] |; /* report stat() errors */ 
return 1: 
' 


show stat info(char * fname, struct stat + buf) 
^x 
"i 


* displays some info from stat in a name = value format 


xf 

f 
printf(". mode: €oXn", buf-—-st mode); /* type + mode x/ 
printf(" links: $d\n", buf -st nlink); ie Æ links + 
printf(" user ; & din", buf ——st uid); /* user id */ 


printf(" group: * din", buf -st gid}; /* group id «/ 


OCC- 一 一 ome c; 一 一 
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printf" size: * din", buf -—st size); /* file size */ 
printf(" modtime: % d\n", buf —»st mtime): /* modified «/ 
printf(" name; % sin", fname 5; /* filename */ 


编译 并 运行 fileinfo, 并 把 它 跟 Is -上 作对 比 ; 


$ ec 7-ofileinfo fileinfo.c 
$ ./fileinfo fileinfo.c 
mode: 100664 
links; 1 
user. 500 
group: 120 
size; 1105 
modtime: 965158604 
name: fileinfo.c 
$ ls -1 fileinfo.c 


—r«—rw-r-- 1 bruce users 1106 Aug 1 15:36 fileinfo.c 


3.6.5 期 何 实现 


链接 数 Clinks) ,文件 大 小 (size) 的 显示 都 没有 问题 ,最 后 修改 时 间 (modtime) 是 time. t 类 
型 的 ;可 以 用 ctime 将 其 转化 成 宇 符 囊 ,也 没 问 题 ， 
fileinfo 将 模式 (tmode) 字 段 以 数字 形式 输出 ,然而 项 要 的 是 如 下 的 形式 ， 


CEW CCIW r -7 


结构 中 的 用 户 所 有 者 tuser) MAA (group) F B D E 3 (El «T de zs h 2E B Rr EA RE P GR 
组 名 ,为 了 完善 1s -1 必须 进一步 处 理 模式 ,用户 名 和 组 的 显示 。 


3.6.6 将 模式 字段 转换 成 字符 


文件 类 型 和 许可 权限 是 如 和 柯 存 铺 在 st_mode H? 又 如 何 将 它们 转 成 10 SEAM BR? 从 
进 制 的 100664 X 53" —rw-rw-r-- 有 什么 关系 呢 ? 对 这 3 个 问题 的 回答 就 构成 了 本 节 
的 内 容 。 

st mode 是 一 -个 16 位 的 二 进 制 数 ,文件 类 型 和 权限 被 编码 在 这 个 数 中 ,如 图 3.4 Bro. 


user croup olher 





3.4 文件 类 型 与 许可 权限 
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其 中 前 4 位 用 作文 件 类 型 ,最 多 可 以 标识 16 种 类 型 ,月 前 已 经 使 用 了 其 中 的 7 个。 

接 下 来 的 3 位 是 文件 的 特殊 属性 ,1 代表 具有 某 个 属性 ,0 代表 没有 ,这 3 位 分 别 是 set- 
user- ID #7 set- group- ID 位 和 sticky fiz. EWR E X Ear. 

最 后 的 9 位 是 许可 权限 ,分 为 3 组 ,对 应 3 种 用 户 , 它 们 是 文件 所 有 者 、 同 组 用 户 和 其 他 
用 户 。 其 他 用 户 指 与 用 户 不 在 同一 个 给 的 人 。 每 组 3 位 ,分 别 是 读 , 写 和 执行 的 权限 。 相 应 
的 地 方 如 果 是 1 ,就 说 明 该 用 卢 拥有 对 应 的 权限 ,0 代表 没有 。 

1. 字段 的 编码 

把 多 和 神 信 息 编码 到 一 个 整数 的 不 同 字 有 段 中 是 一 种 常用 的 技术 ,如 : 


编码 的 例子 
617 — 495 — 4204 mita (RS - me - RS) 
027-93- 1111 社会 保障 号 


128. 103, 33, 100 IP 地 址 


2. 如 何 读 取 被 编码 的 值 

怎么 来 读 取 被 编码 的 值 呢 ? 比如 怎么 知道 212 ~ 222 一 4444 所 对 应 的 区 号 是 212? 很 简 
单 ,一 种 方法 是 将 号 码 的 前 3 位 同 212 比较 , 另 一 种 方法 是 将 暂时 不 需要 的 地 方 置 0, 这 里 把 
电话 号 码 的 后 7 位 置 0, 然 后 同 212 -000 一 0000 比较 。 

为 了 比较 ,把 不 需要 的 地 方 置 0, 这 种 技术 称 为 掩 码 (masking) ,就 如 同 带 上 面 其 把 其 他 
部 位 都 让 起 来 ,就 只 留 下 有 眼睛 在 和 外面。 这 里 用 一 系列 掩 码 来 把 st mode 的 值 转化 成 1s -1 要 
RRB. 

子 域 编码 (subfield coding) a A St 4a f2 rP — fj BE H A RA BRR MA V3 Zr TRE EP 
UG E DUREE RUM 

(00 HEISE: 

掩 码 会 将 不 需要 的 字段 置 0, 需 要 的 字段 的 值 不 发 生 改 变 。 

(2) 整数 是 bit 组 成 的 序列 

整数 在 计算 机 中 是 以 bic 序列 的 形式 存在 的 ,图 3.5 显示 了 如 何以 二 进 制 的 0 和 1 的 串 
来 表示 十 进 制 的 215。 想 -- 下 00011010 表示 十 进 制 的 儿 ? 


)O0s G's ]'s 


adz 128 64 32 16 8 4 3 I 

nS. On poe 

128 64 32 16 8 4 2 | 

?dod fe 
213.5 在 整数 和 二 进 制 数 之 间 转 撞 


(3) FRR AR 
与 0 作 位 与 (各) 操作 可 以 将 相应 的 bit 置 为 0, 图 3.6 是 八进制 的 100664 通过 位 与 操作 
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(4) (B FH BE al 

直接 处 理 二 进 制 数 是 很 枯燥 乏味 的 。 如 同 处 理 一 长 串 十 进 制 数 时 入 们 常 将 它们 三 位 一 
组 分 开 ( 如 23,234,456,022) 一 样 , 一 种 简化 的 方法 是 将 二 进 制 数 每 三 位 分 为 一 组 来 操作 ,这 
就 是 八进制 数 (0 至 7)。 

如 可 以 把 二 进 制 的 1000000110110100 分 为 1,000,000,110,110,100,; 从 而 得 到 八进制 
的 100664, 这 样 更 容易 理解 ， 

3. 使 用 挫 码 打 和 解码 得 到 文件 类 型 

文件 类 型 在 模式 字段 的 第 一 个 字 节 的 前 四 位 ,可 以 通过 掩 码 来 将 其 他 的 部 分 置 0. 从 而 
得 到 类 型 的 值 ， 

在 二 sys/stat.h 访 中 有 以 下 定义 : 


Pdefine S IFMT 0170000 /* type of file «/ 

# define S IFREG 0100000 /* regular «/ 

# define S IFDIR 0040000 ‘a directory x/ 

# define S IFBLK 0060000 /* block special «/ 

# define S IFCHR 0020000 jæ -chaxecter special «/ 
define S IFIFO 0010000 /* fifo »/ 

#define S IFLNK 0120000 J> symbolic link «/ 

s define S IFSOCK 0140000 /* socket »/ 


S IFMT 是 一 个 掩 码 , 它 的 值 是 0170000, 可 以 用 来 过 下 出 前 四 位 表示 的 文件 燃 型 。S_ 


IFREG 代表 普通 文件 , 值 是 0100000,S IFDIR 代表 目录 文件 , 值 是 0040000。 下 面 的 代码 ， 


if (( info. st mode & 0170000) == 0040000 ) 


printf("this is a directory"); 


3B x f 5 dE, C 4i JG XE) B ROR SRR Box m f6 89 He £2. M iip AL BE OX eE-st 
HF, 
更 简单 的 方法 是 用 一 sysystat h2 Pay RRR ERIS. 


/* 
x File type macros 


BÉ define S ISFIFO(m) (((m)&(0170000)) == (0010000)) 
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H define S_ISDIR(m) — (C(125$€01700000) == (0040000)) 
X define S ISCHR(m) — (((m)&(01700000) == (0020000)) 
i define S ISBLK(m) — (((m)&(0170000)) == (00600005) 
# define S ISREG(m)  (((m)&(0170000)) == (01000007) 
使 用 宏 的 话 就 可 以 这 样 写 代码 ， 


if (S5 TSDIRt infa. st mode)? 


printf("this is a directory"); 


4. 解码 得 到 许可 权限 

模式 字段 的 最 低 9 位 是 许可 权限 , 它 标 识 了 文件 所 有 者 AAP .其 他 用 户 的 读 、 写 .执行 
权限 。ls 将 这 些 位 转换 为 短 柳 和 字母 的 串 ， 在 <sysystat. bh 六 中 每 一 位 都 有 相应 的 掩 码 , 下 
面 的 代码 给 出 了 如 何 使 用 的 例子 ， 


* This function takes a mode vaiue and a char array 
* and puts into the char array the file type and the 
* nine letters that correspond to the bits in mode, 
* NOTE: It does not code setuid, setgid, and sticky 
* Codes 
* / 

void mode to letters( int mode, char str[ |) 

{ 


Strepy( str, "SoS eSe ee = “>> /* default = no perms */ 
if ( S_ISDIR(mode} ) str[0. = 'd'; /* directory? x/ 

if ( § ISCHR(mode) ) str| 0, = 'c'; /* char devices */ 

if ( 5 ISBLA(mode) ) str| j = 'b'; /* block device «/ 

if ( mode & 5 IRUSR ) str; 1] = 'r* /* 3 bits for user x»/ 
if ( mode & S IWUSR ) str[2] = 'w'; 

if ( mode ES IXUSR ) str[3] = 'x'; 

if ( mode & S IRGRP ) str[4: = 'r'; /* 3 bits for group x/ 
if ( mode & 5 IWGRP ) str[ 5! = 'w'; 


if ( mode & S. IXGRP ) str[6; = 'x'. 


if ( mode & S IROTH ) str|7] = 

if ( mode & S IWOTH ) str[8] = 'w'; 

if ( mode & $ IXOTH 5 str[3] = 'x'; 
| 


| 
H 


/* 3 bits for other +/ 


5. 解码 并 编写 ds 
到 此 为 止 ; 已 经 可 以 正确 处 理 文件 大 小 ,链接 数 , 文 件 各 .模式 ,最 后 修改 时 间 ， 最 后 还 


PSH 目录 与 文件 属性 : HS ls + (9: 


-— 


有 一 个 要 解决 的 问题 是 文件 所 有 者 Cuser) 和 组 (grouPp) 的 表示 。 
3.6.7 将 用 户 /组 ID BRASS 


在 struct stat 中 ,文件 所 有 者 和 组 是 以 1D 的 形式 存在 的 ,然而 ls 要 求 输出 用 户 名 和 组 
名 ,如 何 根 据 TD 找到 用 户 儿 和 组 名 呢 ? 

可 以 斌 着 在 联机 帮助 中 查找 关键 字 username, uid. group, AAA (EA ZR. 不同 的 系 
统 中 得 到 的 结果 很 不 相同 。 下 面 是 一 些 说 曲 ， 

(1) /eic/passwd @ SIAR SIR 

回想 -下 登录 过 程 , 输 和 人 用户 名 和 密码 ,经 这 验证 后 登录 成 功 , 出 现 提 示 符 。 系 统 怎 么 
知道 用 户 名 和 密码 是 正确 的 ? 

这 就 涉及 到 ,etc/passwd 这 个 文件 , 它 包 含 了 系统 中 所 有 的 用 户 信 息 , 下 面 是 一 个 例子 : 


root :WERAdlOwUxypE:0:0-root:/bin/bash 

bin: # :1;1:/bin;/bin: 

daemon: * :2;2:daemon:/sbin: 

snith:xlmEPcp4Tnokc.9768 -3073 :Jame Q Smith: /home/s/smith/. 
/ahells/tcsh 

fred:mSuVNOF4CRETImE:20359 .550.Fred:/home/f/fred:/shells/tcsh 

diane -7oUS8f1Psrec¥ -20555-550-Diane Abramov: /home/d/diane: 
/shells/tcsh 

ajr:WitmEBWylarlw:3607:3034.Ann Reuter: home/a/ajr;/shells/bash 


这 是 个 纯 文本 文件 ,每 一 行 代表 ~-- 个 用 户 , 用 冒号 “;” 分 成 不 同 的 字段 ,第 一 个 字段 是 用 
户 名 ;第 二 个 宇 段 是 密码 ,第 三 个 字段 是 用 户 ID ,第 四 个 字段 是 所 属 的 组 , 接 下 来 的 是 用 户 的 
全 名 EASA POE shell 程序 的 路 径 。 所 有 的 用 户 对 这 个 文件 都 有 读 权 限 , 关 于 这 个 文 
件 的 详细 信息 ,参见 联机 帮助 ， 

似乎 使 用 这 个 文件 就 可 以 解决 用 卢 ID 和 用 户 名 的 关联 问题 ,只 宕 搜索 用 户 ID, 然 后 就 
可 以 得 旬 相 应 的 用 户 名 。 然 而 在 实际 应 用 中 并 不 是 这 样 做 的 ,搜索 文件 是 一 件 很 繁琐 的 上 
作 ,而 且 对 于 很 多 网 络 计算 系统 ,这 种 方法 是 不 起 作用 的 。 

(2) /etc/passwd 并 没有 包括 所 有 的 用 户 

每 个 Unix 系统 都 有 /etc/passwd 这 个 文件 ,但 它 并 没有 包括 所 有 的 用 户 , 在 有 些 网 络 计 
算 系 统 中 ,由 户 要 能 够 登录 到 系统 中 的 任何 一 台 主 机 上 ,如 果 通 过 /etc/ passwd 来 实现 ,就 必 
须 在 所 有 的 主机 上 维护 用 户 们 息 ,要 修改 密 碚 的 话 也 必须 修改 所 有 主 宙 上 的 密码 ,如 有 果 有 一 
台 主 机 同好 穷 机 了 ,那么 在 宕 机 期 间 的 用 户 变 化 情况 就 无 法 同步 到 这 人 台 主 机 上 。 

较 好 的 解决 方法 是 在 一 台大 家 都 能 够 访问 到 的 主机 十 保 存 所 有 用 户 信息 , 它 被 称 做 
NIS, 所 有 的 主机 通过 NIS 来 进行 肌 户 身份 驻 证 。 所 有 需要 用 户 信息 的 程序 也 从 NIS LA 
取 。 而 本 地 只 保存 所 有 用 户 的 一 个 子 集 以 备 离线 操作 。 在 联机 帮助 中 有 NIS 的 详细 
信息 - 

(3) 通过 getpwuid 3€ $8 Bl 5c RE G8 H1 P VK 

可 以 通过 库 晒 数 getpwuid 来 访问 用 户 信息 ,如 果 用 户 信 息 保 存在 /etc/passwd 中 ,那么 
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getpwuid 43& Jg /etc/passwd 的 内 容 , 旭 果 用 户 信 息 在 NIS 中 ,getpwutd 会 从 NIS 中 获取 信 
息 ,所 以 用 getpwuid 使 程序 有 很 好 的 可 移植 性 。 | 

getpwuid 需要 UIDCuser ID) 作 为 参数 ,返回 -P TR i8] struct passwd 的 指针 ,这 个 结构 
«E X. TE / usr/include/pwd. h 中 : 


/* The passwd structure «/ 


struct passwd / 


char * pw name; /* Username x / 

char * pw passwd; /* Password */ 

. uid t pw uid; /* User ID x/ 

| gid t pw gid; /^* Group ID #/ 

char + pw gecos; /* Real name x/ 

char * pw dir; /* Home directory */ 
char * pw shell; /* Shell Program */ 


^r 


这 下 是 1s -1 的 输出 中 需要 的 : 


fot 
x returns a username associated with the specified uid 
x NOTE: does not work if there is no username 
if 
char * uid to name(uid t uid) 
i 
return getpwuid(uid) — >> pw name; 


; 


这 段 代码 很 简单 ,但 还 不 够 健壮 ,如 果 uid 不 是 一 个 合法 的 用 户 ID, AB getpwuid 返回 空 
指针 NULL ,这 时 getpwuid(uid) — pw. name 就 没有 意义 ,这 种 情况 会 发 生 吗 ?常用 的 ls 
命令 有 一 种 处 理 这 种 情况 的 办 法 。 

(4) UID 没有 对 应 的 用 户 和 名 

假设 在 一 台 Unix 主机 上 有 一 个 账号 ,用 户 名 是 pat. FH P ID 是 2000, 创 建 了 一 个 文件 ， 
这 个 文件 的 st uid 的 值 就 是 2000, 

假设 一 段 时 间 以 后 你 搬 走 了 ,系统 管理 员 于 是 把 这 个 账号 删除 ,在 passwd 中 不 再 有 pat 
这 一 行 , 这 时 如 果 getpwuid 得 到 的 参数 是 2000, 它 就 会 返回 NULL. 

标准 的 1s 如 果 遇 到 这 种 情况 ,会 打印 出 UID。 

当 新 加 和 人 一 个 用 户 时 ,新 用 户 有 可 能 与 一 个 已 补 删除 的 用 户 有 相同 的 UID, 这 时 , 老 用 
户 所 留 下 来 的 文件 会 被 用 户 所 拥有 ,新 用 户 对 这 些 文件 具有 所 有 的 权限 。 

最 后 一 个 问题 是 组 ID 如 和 何 处 理 ?” 什么 是 组 ? 什么 是 组 DID? 

(5) /etc/group 是 组 的 列表 

对 一 台 公 司 里 的 主机 而 言 ,可 能 要 将 用 户 分 为 不 同 的 组 ,如 销售 人 员 一 组 ,行政 人 员 一 
组 等 。 要 是 在 学 校 时 ,可 能 有 教师 组 和 学 生 组 。Unix 提供 了 进行 组 管理 的 手段 ,文件 
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/etc/group 十 一 个 保存 所 有 的 组 信息 的 文本 文件 ， 


root: :0 :root 

other::1: 
bin::2:root,bin,daemon 
Sys::3:root,bin,sys,adm 
adm::4:root,adm,dacmon 
uucp::5:root,uucp 
mail-::6:root 
tty::7:root,tty, adm 
lp;;B.root,lp,adm 


第 一 个 字段 是 组 包 ,第 二 个 是 给 密码 ,这 个 字段 极 少 用 到 ,第 三 个 是 组 ID4GID) ,第 四 个 
是 组 中 的 成 员 列 表 。 

(6) 用 户 可 以 同时 属于 多 个 组 

passwd 文件 中 有 每 个 用 户 所 属 的 组 ,实际 那里 死 出 的 是 用 户 的 主 组 (primary group), 
用 户 还 可 以 是 其 他 组 的 成 员 ,要 将 用 户 添 加 到 组 中 ,只 要 把 它 的 用 户 名 渗 加 到 /etc/group 中 
这 个 组 所 在 行 的 最 后 一 个 字段 即 可 。 在 刚才 的 例子 中 ,用 户 adm 同时 属于 sys .adm .tty、lp 
等 多 个 组 。 这 个 列表 在 处 理 给 访问 权限 时 会 被 用 到 。 例 如 -个 文件 属于 lp 组 , 目 组 成 员 有 
这 个 文件 的 写 权 限 , 所 以 用 户 adm 就 可 以 修改 这 个 文件 。 

(7) 通过 getgrgid 来 访问 组 列表 

在 网 络 计算 系统 中 ,组 信息 也 被 保存 在 NIS 中 ，Unix 系统 提供 getgrgid oh KF RPK 
现 的 差异 。 用 这 个 匡 数 ,用 户 可 以 得 到 组 名 而 不 用 操心 实现 的 细节 。getgrgid 的 用 户 手册 对 
这 个 函数 及 相关 函数 做 了 详细 解释 。 在 ls -1I 中 ,可 以 这 样 得 到 组 名 : 


fx 
* returns a groupname associated with the specified gid 
* NOTE: does not work if there is no groupname 
x/ 
char * gid to name(gid t gid) 
{ 
return getgrgid(gid) —>qr_name; 
} 


3.6.8 编写 Is2.¢ 


Mls 一 1 的 每 一 项 输出 ;都 有 办 法 将 它们 转换 为 用 户 可 理解 的 格式 。 把 它们 综合 起 来 ， 
就 得 到 了 以 下 代码; 


/* ls2.c 
* purpose list contents of directory or directories 
x action if no args, use . else list files in args 


x note uses stat and pwd. h and grp. h 
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x BUG: try 152 /tmp 

¥ 

it include < stdio. h^ 

# include = sys; types. h 
# include dirent, h 


#4 include < sys/ stat. h> 


void do_ls(char[]); 

void dostat(char *): 

void show file info( char * , struct stat * ) 7 
void mode to letters( int , char | | 5; 

char x uid to name( uid t ); 

char «gid to name( gid t ); 


main(int ac, char * ev[ |) 
i 
if {ac == 1?) 
do lsc "."); 
else 
while ( -~ac }{ 
printf("& s;in", x +tav}; 
do ls( xav); 


| 


void do ls( char dirname| | ) 

je 
* list Files in directory called dirname 
xi 


l 


DIR x dir ptr; /* the directory */ 


struct dirent * direntp; /* each entry x/ 


itt € dir ptr = opendir( dirname ) ) == NULL} 





fprintf(stderr,"lsl: cannot open $ s\n", dirname); 


else 
i 
while ( ( direntp = readdir( dir ptr } > 1 
dostat( direntp —2»d name ); 
closedir(dir ptr); 


void dostat( char * filename ) 
i 


l 


struct stat info; 


NULL ) 
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if ( stat(filename, &info) == - 1) /* cannot stat «/ 
perror( filename }; /* Say why x/ 
else /» else show info +/ 


show file info( filename, &info ); 


void show file info( char «x filename, struct stat * info p) 


i 


i 


; 


* 
* display the info about filename. The info is stored in struct at x info p 


+; 


char  *uid to name(), ¥ctime(), * gid to name(), » Filemode()-; 
void mode to letters(); 


char modestr|11!; 
mode to letters( into pst mode, modestr 5; 


printf( "$s" , modestr }; 

printf( "& 4d " , (int? info p-——st nlink): 

printf( "X - Bs" , uid to name(info p-—st uid) ); 
printf( "$ -8s", gid to nametinfo p-st gid) 5; 
printfi "& Bld" (1onj)info p- st size); 

printf( "%.123 " 4+ ctime(&info p-—7st mtime)); 


printti "$ s\n" , filename ):; 


E 
* 


* utility functions 


F 


/ * 


* This function takes a mode value and a char array 
* and puts into the char array the File type and the 
* nine letters that correspond to the bits in mode. 
x NOTE: It does not code setuid, setqid, and sticky 
* codes 


*/ 


void mode to letters( int mode, char str |) 


| 


trong SER. Does cU ER "Jj; /* default = no perms «/ 
if ( 8 ISDIR(mode) ) strlO! = 'd'; /* directory? «/ 

if ( S ISCHR(mode) ) sti[0] = 'c'; /* char devices */ 

if ( 8 ISBLK(Omode) ) str[0] = ‘tbs /* plock device »/ 

if ( mode & S IRUSR ) str[1j = 'r'; /* 3 bits for user */ 
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if ( mode & S, INUSR ) str[2] = 'w'; 
if ( mode & S IXUSR ) str(3] = 'x'; 


if ( mode & S IRGRP ) str[4] = 'r’; /* 3 bits for group +/ 
if ( mode & S IWGRP ) str[5]| = 'w'; 
if ( mode & S IXGRP ) str[6] = 'x'; 


if ( mode & 5 IROTH ) str[7; = irt; /* 3 bits for other «/ 
if ( mode & S TWOTH ) str[8] = 'w'; 
if ( mode & S IXOTE ) str[9] 


II 
x 


# include < pwd. h> 


char «x uid to name( uid t uid } 
f 


* returns pointer to username associated with uid, uses getpw() 


1 


*/ 


Struct passwd * getpwuid(), * p« ptr; 
static char numstr|10]; 


if (C pw ptr = getpwuid( vid) ) == NULL | 
sprintf(numstr," * d", uid); 
return numstr: 

} 

else 


return pw ptr ——pw name 


h 
[i 


# include —grp.h-— 


char + gid to name( gid t gid ) 


J 


{ 


fag 


* returns pointer to group number gid. used getqrgid(3) 


*/ 


struct group * getgrgid(), * grp ptr; 
static char numstr[ 10]; 


if ( ( grp ptr = getgrgid(gid) ) == NULL ) | 
sprintf(numstr," € d", gid); 
return numstr: 


} 


else 


return grp ptr ---gr name; 





将 1s2 的 输出 与 标准 的 1s 对 比 : 
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5 ls2 

drwxrwxr-x ^ 4 bruce bruce 1024 Aug 2 18:18 

CdrwxrwXr -x 5 bruce bruce 1824 Aug 2  18;14 

-rw-rw-r-- 1 bruce users 30720 Aug 1 12:05 s.tar 
-CWxIWHY -X 1 bruce Users 37351 Aug ) 12:13 taill 
-rw-rw-r-- 2 bruce users 345 Jul 29  11;05  Makefile 
-DWe-f--Le- 1 bruce users 723 Aug 1 14:26 dIJlsl.c 
uIW-I--r-- 1 bruce users 3045 Feb 15 03:51  1s2.c 
-rw-rw-r-- 1 bruce users 27521 Aug 1 12:14  chap03 
drwxrwxr-x 2 bruce users 1024 Aug 1 12;14 old src 
drwxrwXr-x 2 bruce users 1024 Aug i 12.15 docs 
-IWXIWXE-X ] bruce bruce 37048 . Aug 1 14:26 Isl 
—rw-r—-r-— 1 bruce support 946 Feb 18 17:15 statl.c 
-YWXIWXE—x 2 bruce bruce 42295 Aug 2 18.18  is2 
-Iw-r--r-- 1 bruce support 191 Feb 21:01  statdemo.c 
-rwW-r--r-- i bruce users i416 = Aug 12:05  taill.c 
$ is -1 

total 189 

TWIN 2 bruce users 345 Jul 28 11:05 Makefile 
-rw-rw-r-- 1 bruce users 27521 Aug 1 12-14  chap03 
drwxrwxr-x Z bruce users 18024 Aug 1 12;15 does 
—rwWXIWXr-X 2 bruce bruce 42295 Aug 2 18.18 = 1s2 
-rYW-I-.-r-— 1 bruce users 323 . Mug 1] 14:26  l1si.c 
—EWXIWXI-X 1 bruce bruce 37048 Aug 1 14;26 isl 

RE gfe ee a 1 bruce users 3045 Feb 15 03-51 1s? .c 
drwxrwxr-x 2 bruce users 1024 Aug 1 12:14 old src 
-rW-IW-r-— ] bruce users 30720 Aug 1 12:05 s.tar 
zrw-E--pee ] bruce support 946 Feb 16 17:15  statl.c 
-IWw-r--r-- 1 bruce support 131 Feb 9 1998 = statdemo.c 
—rWXIWAXY-X 1 bruce users 37351 Aug 1 12:13 taili 
-rw-r--r-- 1 bruce users 1416 Aug 1 12:05 tailt.e 
3 


« Bb « 


Is2 的 输出 者 起 来 已 经 很 不 错 了 ,模式 字段 ,用户 名 和 组 和 名 的 处 理 已 经 完成 。 但 还 有 些 工 
作 要 做 。 标 准 的 ls 会 显示 记录 总 数 ,1s2 不 会 ,而 且 152 还 没 将 结果 按 文件 名 排序 ,也 不 支持 
选项 -a。 它 还 假设 参数 是 目录 名 ， 

IsZ 还 有 一 个 致 全 的 问题 ,不 能 显示 指定 目录 的 信息 ;你 可 以 试 一 试 ,在 命令 行 输入 : 
ls2 tmp。 可 以 在 本 章 结 尾 的 练习 中 修正 这 些 问题 。 
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3.7 二 个 特殊 的 位 


结构 stat 中 的 st_mode 成 员 包 会 16 位 ,其 中 4 位 用 作文 件 类 型 ,9 位 用 作 许 可 权限 , 剩 
下 的 f FACE CPP RRR RE. 


3.7.1 set-user-ID 位 


在 这 3 位 中 ,第 一 位 叫做 set - user - TD 位 , 它 的 出 现 是 为 了 解决 一 个 重要 的 问题 , 即 用 
户 如 何 更 改 自己 的 密码 ? 

看 起 来 好 像 很 容易 ,用 passwd asd sur. 

接 下 来 研究 一 下 passwd 的 工作 原理 , 先 来 看 /etc/passwd 这 个 文件 ,注意 这 个 文件 的 所 
有 者 利文 件 访 问 权 限 设置 : 


ġ lg — 1 /etc/passwd 
-r«-r--r-- l] root root  B94 Jun 20 19-17  /etc/passwd 


更 改 密码 会 导致 上 述 文 件 内 容 的 变化 ,但 是 普通 用 户 没 有 修改 这 个 文件 的 权限 ,只 有 
root HA F A ERE passwd 命令 怎么 能 够 修改 这 个 义 件 呢 ? 

解决 的 办 法 ,不 是 给 所 有 用 广 修 改 这 个 文件 的 权限 ,而 是 给 passwd 命令 一 个 特殊 的 权限 ， 
使 passwd 命令 的 文件 所 有 者 是 root, 而 且 它 的 特殊 属性 中 包含 set user -iD 位 ;如 下: 


$ ls - 1 /usr/bin/passwd 
-r-sr.xr-x l root bin 15725 Oct 31 1997 /usr/bin/passwd 


SUID 和 位 告诉 内 核 , 运 行 这 个 程序 的 时 候 认 为 是 由 文件 所 有 者 丰 运行 这 个 程序 ,在 这 里 
就 是 root, ih] root 有 修改 /etc/ passwd 的 权限 ， 

L 是 否 可 以 别 下 其 他 用 户 的 密码 ? 

管 案 是 否定 的 ,passwd 命令 知道 是 谁 在 运行 程序 。 它 用 系统 调用 getuid 来 得 到 用 户 ID, 
passwd 命令 是 可 以 修改 ,etc/'passwd 这 个 文件 ,但 它 只 会 修改 该 用 户 ID 所 对 应 的 密码 ， 

2，set 一 user 一 的 其 他 用 外 

SUID 位 经 常用 来 给 其 些 程序 提供 额外 的 权限 ,比如 系统 中 的 打印 队列 。 有 可 能 同时 有 
很 过 用 户 发 出 打印 请 求 , 但 系统 只 有 一 台 打 印 机 ,这 时 要 把 打 邢 请求 都 放 到 打印 队列 中 去 ， 
命令 jpr 负责 把 用 户 要 打印 的 文件 复制 到 一 个 特定 的 系统 目 洒 中 去 。 如 果 这 个 自 录 所 有 用 
户 都 有 访问 权限 , 那 将 会 产生 一 些 不 安全 因素 , 晋 意 用 户 有 删除 六 人 的 打印 作业 的 可 能 。 设 
置 jpr 的 SUID 位 就 可 以 解决 这 个 间 题 ,使 lpr 的 文件 所 有 者 是 root 和 lpr。 当 一 个 普通 用 户 
调用 lpr 时 ,lpr 就 以 root 或 lpr 的 权限 运行 ,可 以 对 这 个 系统 目录 进行 操作 ,而 车 通用 户 却 
不 能 直接 对 这 个 日 录 进 行 控制 。 执 行 从 打印 队列 称 除 操作 的 程序 也 是 设置 SUID 的 。 

一 些 游 戏 会 把 成 绩 最 好 的 用 户 的 信息 写 人 数据 库 或 记录 文件 ,可 以 把 这 些 执行 写 动 作 
的 程序 的 文件 所 有 者 设 为 数据 库 或 记录 广 件 的 所 有 者 ,再 设 上 set-user-ID 位 ,这 样 普通 用 
户 玫 可 以 玩 洲 戏 , 介 只 有 游戏 程序 才 可 以 修改 成 绩 ， 
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3. Ai SUID 位 的 掩 码 
亲 以 通过 二 sys/stat.h 活 中 定义 的 掩 码 来 检验 某 一 个 程序 是 否 有 SUID fv: 





H define 3 ISUID 0004000 /* set user ID on execution */ 
将 它 转换 为 二 进 制 ,将 会 看 到 它 正好 是 3 TRAM Bie. 
3.7.2 set- group - ID fz 


第 二 个 特殊 属性 位 是 用 来 设置 程序 运行 时 所 属 组 的 ,如 果 一 个 程序 所 属 的 组 设 为 g 
HEB set-group- ID 位 也 被 设置 ,那么 程序 运行 的 时 候 就 好 像 它 正 被 gg 组 中 的 某 一 个 用 户 
运行 一 样 。set-group-ID 位 给 程序 某 一 个 组 的 访问 权限 。 

可 以 通过 所 sysy stat, hh 六 中 定义 的 掩 码 来 检验 某 一 个 程序 是 否 有 set - group ID f; 


#define 5S ISGID 0002000 /*set group ID on execution’ 


3.7.3 sticky 位 


sticky 位 对 于 文件 和 月 录 有 不 同 的 骨 途 。 对 于 文件 而 言 , 早 期 的 Unix 系统 经 常 要 在 有 
限 的 内 存 中 同时 运行 很 多 程序 , 它 使 用 到 交换 (swap) 技 术 。 例 如 系统 中 内 存 只 有 1MB 的 剩 
238 JR] ERAREMA 3 个 程序 ,每 个 需要 0. OMB 的 内 存 , 很 明显 ,剩余 空间 只 人 允许 呐 个 
程序 待 在 内 存 中 。 在 某 个 时 息 如 吕 某 个 程序 设 适 行 , 内 核 会 把 它 临 时 地 存放 到 硬 烙 上 一 个 
帅 变换 空间 的 分 区 中 , 空 出 来 的 内 存 可 以 给 其 他 程序 使 用 , 当 在 交换 空间 中 的 程序 将 要 再 次 
运行 时 ,内 核 会 把 它 装 载 到 内 存 中 ， 

从 交换 空间 装载 程序 要 比 从 普通 的 硬盘 空间 快 ,在 非 交 换 空间 的 硬盘 上 ,程序 可 能 被 分 
成 好 几 卖 分别 存 放 在 多 个 地 方 ,交换 空间 上 的 文件 是 不 分 块 的 。 

一 些 经 常用 到 的 程序 ,如 编辑 器 .编译 融和 游戏 ,她 果 位 于 交换 空间 上 ,那么 装载 的 速度 
就 会 快 得 多 。sticky 位 告诉 内 核 即 使 没有 人 在 使 用 程序 ,也 要 把 它 放 在 交换 空间 中 。 RIEN 
在 变换 空间 中 ,就 好 像 口香糖 粘 在 鞋子 上 一 样 。 

现在 ,交换 技术 已 经 不 像 以 前 那么 重要 了 ,取而代之 的 是 虚拟 内 存 技 术 , 虚 拆 内 存 使 得 
可 以 以 更 小 的 单位 ,如 页 (page) ,进行 交换 。 

MFA Si sticky 的 会 义 是 不 同 的 。 有 些 目 录 被 设计 用 来 存放 临时 文件 ;如 /tmp, 谁 
都 可 以 往 这 里 创 建 / 删 除 文 件 ,sticky 位 使 得 目录 里 的 文件 只 能 被 创建 者 删除 。 


3.7.4 用 1s-1 看 到 的 特殊 属性 


正如 刚才 所 看 到 的 ,每 个 文件 有 12 位 的 文件 属性 ,但 ls 只 用 9 个 字符 来 表示 , 它 是 如 何 
来 表示 的 呢 ” 
来 看 下 面 的 例子 : 


.rwsr-sr-t 1 root root 2345 Jun 12 14:02 sample 
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在 许可 权限 部 分 ,用 户 的 x 被 替换 成 s, 代 表 set-user- ID MERE AAP x ERIS ss, 
代表 set-group~ID 被 设置 ,其 他 用 户 的 x 被 替换 成 t, 代 表 sticky 被 设置 ,更 详细 的 信息 参 
由. 联机 帮助 。 


3.8 Is 小 结 


本 章 编写 的 ls 程序 可 以 列 出 目录 里 的 文件 ,还 可 以 列 出 文件 的 详细 依 息 。 在 分 析 和 实 
现 的 过 程 中 ,应 该 可 以 学 到 Unix 很 多 方面 的 知识 。 

(1) 文件 与 自 录 

Unix 将 数据 存放 于 文件 中 , 日 录 是 特殊 的 文件 , 它 的 内 容 就 是 其 中 的 文件 和 子 目 录 的 名 
字 ,还 包含 自己 的 名字,Unix 提供 一 系列 函数 对 呈 录 操作 ,打开 ,. 读 、. 定 位 .关闭 等 ,但 不 提供 
5 A ot A) ER EC, 

(2) 用 户 与 组 

系统 中 的 每 个 用 户 都 有 用 户 名 和 用 户 ID. 人们 可 以 用 用 户 名 登录 到 和 系统。 系统 通 过 
UID 来 区 分 不 间 用 户 的 文件 。 每 个 用 户 都 属于 至 少 一 个 组 。 每 个 组 者 有 组 名 和 组 ID. 

(3) 文件 属性 

每 个 文件 都 有 很 多 属性 ,程序 通过 系统 调用 stat 来 得 到 文件 的 属性 。 

(4) 文件 的 所 有 关系 

每 个 文件 都 有 文件 所 有 者 ,文件 所 有 者 的 ID 是 文件 属性 的 一 部 分 。 同样 的 每 个 文件 都 
属于 某 个 组 ,组 ID 也 是 文件 属性 的 一 部 分 。 

(5) 许可 权限 

文件 的 许可 权限 规定 了 哪 种 用 户 可 以 进行 鄙 些 操作 ,有 3 种 用 户 : 文件 所 有 者 、 同 组 用 
户 和 其 他 用 户 ,3 种 操作 : 读 . 写 和 执行， 


3.9 设置 和 修改 文件 的 属性 


文件 有 很 多 属性 ,js -1 可 以 列 出 来 ,这 些 属性 是 如 何 建立 的 ? 是 耕 可 以 改变 文件 的 属 
性 ? 如 果 可 以 ,如 何 改 ?如 果 不 可 以 ,为 什么 ? 这 是 接 下 来 要 介绍 的 问题 ， 


-rW-r--r-— 1 bruce users 3045 Feb 15 03:51]  1s2.c 
从 堪 到 右 来 看 文件 182. c 的 属性 ， 
3.9,1 文件 类 型 


文件 的 类 型 有 普通 文件 .目录 文件 .设备 文件 .socket 文件 .符号 链接 文件 .命名 管道 
(named pipe) X fF A , 

CL) 文件 类 型 的 建立 

文件 燃 型 县 在 创建 文体 的 时 候 建 立 的 ,如 用 系统 调用 creat 建立 一 个 普通 文件 。 其 他 类 
型 的 文件 如 和 目录、 设备 等 ,可 和 使 用 不 问 的 函数 创建 。 
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(2) 修改 文件 类 型 
文件 一 经 创建 ,类 型 就 无 法 修改 ,虽然 在 童话 里 ,南瓜 可 以 蛮 成 马车 ,但 这 里 的 文件 类 型 


是 不 能 变 的 。 
3.9.2 许可 位 与 特殊 局 性 位 


每 个 文件 都 有 9 位 的 许可 权限 和 3 位 的 特殊 属性 ,它们 是 在 文件 创建 的 时 收 建 立 的 , 创 
建 以 后 ,它们 可 以 被 chmod 系统 调用 修改 。 

C1) 建立 文件 的 模式 

creat 的 第 二 个 参数 指定 了 要 创建 文件 的 许可 位 , 旭 : 


fd = creat( "newfile", 0744 ); 


指定 新 创建 文件 的 许可 位 为 rwxr-r--. 

这 个 参数 只 是 请 求 , 而 不 是 命令 。 内 核 会 通过 “新 建文 件 撞 码 ”(file- creation mask) 
来 得 到 文件 的 最 终 模式 .“ 新 建文 件 掩 码 "是 一 个 很 有 用 的 系统 变量 , 它 指定 哪些 位 需要 
被 关 掉 。 例 如 要 防止 程序 创建 能 被 同 组 用 户 和 其 他 用 户 笑 改 的 文件 ,那么 可 以 通过 关 掉 
---~w--wWw- 来 实现 。 这 可 以 通过 把 “新 建文 件 掩 码 ” 的 值 设 为 八进制 数 022 来 实现 。 
例如 : 


umask( 022 }; 


这 里 的 umask 是 一 个 系统 命令 ,可 以 改变 变量 umask 的 的 值 。 
(2) 改变 文件 的 模式 
程序 可 以 通过 系统 再 用 chmod 来 改变 文件 的 模式 ;如 : 


chmod( "/tmp/myfile", 04764) - 
chmod( "/tmp/myfile" i S ISUID| S IRWXU| S_IRGRP}S IWGRP|S IROTH 5; 


上 述 两 条 指令 的 作用 相同 ,第 一 条 是 八进制 来 表示 ,第 二 条 是 用 过 sysistat. h (Pig X. 
的 符号 来 表示 。 后 者 有 明显 的 优点 , 当 系 统 定义 的 许可 位 的 值 改变 时 ,无 需 修 改 程 序 。 系 统 
调用 chmod 不 受 “ 新 建文 件 掩 码 ”的 影响 ，。 


chmod 

目标 收 改 交 件 的 许可 权限 和 特殊 篇 性 
头 文 件 # include < sys/types, h> 

+ include < sys stat, h^ 
A Se ie int result = chmod(char * path, mode, t made}; 
参数 path 文件 各 

mode ”新 的 许可 权限 和 和 特殊 饮 性 
iE Ip] fn =] 过 到 错误 


9 成 功 返 回 
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(32 用 来 修改 文件 的 许可 权限 和 特殊 属性 的 命令 
Shell 命令 chmod 也 可 以 用 来 完成 上 述 操 作 。 它 可 以 通过 两 种 模式 指定 权限 和 属性 ,入 
进 制 模式 {如 04764) FES kh (A u= rws g=rw or), 


3.9.3 文件 的 链接 数 


关于 链接 数 的 详细 讨论 在 于 一 章 。 简 而 言 之 ,链接 数 就 是 文件 被 引用 的 次 数 ( 别 名 的 数 
量 ) 。 如 果 -个 文件 在 日 录 树 中 一 共有 3 个 别名 ,那么 这 个 文件 的 链接 数 就 是 3。 增 加 文件 
的 别名 (使 用 link)y 会 使 链接 数 增 加 ,减少 别名 (使 用 unlink) 会 使 链接 数 减 少 。 


3.9.4 文件 所 有 者 与 组 


每 个 文件 都 有 文件 所 有 者 ,Unix 通过 用 户 ID 和 组 1D 来 标识 文件 所 有 者 和 文件 所 属 
的 组 。 

(OD 文件 所 有 者 

简单 的 说 ,文件 所 有 者 就 是 创建 文件 的 用 上 户 , 用 户 通过 creat 建立 文件 时 ,内 核 把 文件 所 
有 者 设 为 运行 程序 的 用 户 , 旭 果 程序 具有 set-user-ID 位 ,那么 新 文件 的 文件 所 有 者 就 是 程 
序 的 文件 所 有 者 。 

(2) £H | 

通常 情况 下 ,新 文件 的 组 被 设 为 换行 创建 动作 的 用 户 所 在 的 组 ,站 有 些 情况 下 ,组 会 被 
设 为 与 父 日 录 的 组 相同 。 这 上 听 起 来 好 像 婴 儿 的 国籍 由 出 生地 决定 而 不 由 父母 的 同 籍 来 决定 ， 

(3) 修改 文件 所 有 者 和 组 

通过 系统 调用 chown 来 修改 文件 所 有 者 和 组 : 


chown( "filel", 200, 40); 


将 文件 fuel 的 用 户 ID eio 200,28 TD RA 40, lH Je PP CRI (EB Je 135 A RE 
所 有 者 和 组 都 不 会 改变 。 一 般 用 户 不 大 会 修改 文件 的 文件 所 有 着 和 组 ,但 root 经 常 出 于 管 
理 上 的 旧 的 要 修改 这 些 内 容 。 文 件 所 有 者 可 以 把 文件 的 组 改 成 尾 何 一 个 他 所 属 的 组 。 


chown 
目标 修 玻 文件 所 有 者 和 组 
头 文件 it include <unistd. hh > 
7 函数 原型 oe on aid oases E, 


参数 path ”文件 名 
owner ăi AA iD 
group ”新 的 组 ID 

ix [ul fa 25] 示人 到 错误 
Ü 成 功 返 回 


(4) 用 米 收 改 文 件 所 有 者 和 组 的 命令 
Shell 命令 chown 和 chgrp 可 以 用 来 修改 文件 所 有 者 和 组 ,它们 可 以 一 次 修改 多 个 六 忻 ， 


———.. —— 一 一 一 一 db e eg i m ms m mmm 
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可 以 用 用 户 名 /组 名 作为 参数 ,也 可 以 用 用 户 ID ID PAB. EF EDT BY ae te H 
BS LEK OLA BH 


3.9.5 文件 大 小 


文件 .目录 和 命名 管道 的 大 小 是 它们 实际 所 占用 的 存储 空间 的 字 GEB. SAR 
如 内 容 时 ,文件 的 大 小 会 睛 动 增加 ,可 以 使 用 系统 调用 creat EITM ACD EA 0. AF TERE 
够 直接 减 小 文件 占用 的 空 加 的 晒 数 -。 


3.9.6 时间 


每 个 文件 都 有 3 个 时 间 : AR a eC modification) yy 时间, 最 后 访问 (accessy 时 间 和 属性 
{如 用 户 所 有 者 已 .许可 权限 ?最 后 修改 时 间 , 当 文件 被 操作 时 ,内 核 会 日 动 地 修改 这 些 时 间 ， 
也 可 以 编程 来 修改 最 后 修改 时 间 和 最 后 访问 时 间 ， | 

(12 修改 最 后 修改 时 间 和 最 后 访问 时 间 

utime 系统 调用 可 以 用 来 设置 最 后 修改 时 间 和 最 后 访问 时 间 ,使 用 : -个 包 会 两 个 time_t 
结构 的 变量 ,- 一 个 umet 用 来 存放 更 新 的 最 后 修改 时 间 , 另 一 个 是 最 后 访问 时 间 。 


utime 

目标 艇 改 文件 最 后 修改 时 间 和 最 后 访问 时 间 BEEN 

# include «sys/time, h> ] 
3k x PF # include <lutime, h> 

# include < asys/ types. hi> 
oF OX d “int utime(char * path, struct utembuf * newtimes) 

path x PE 
f$ newtimes 指向 结构 变量 utimbuf 的 指针 

FÉ KW, utime, h 

返回 值 B a 

0 战功 返回 


什么 时 候 需 要 做 改 这 些 时 间 电 ” 举 个 例子 ;在 文件 贷 份 的 时 收 , 文 件 的 最 后 修改 时 间 和 和 
沪 问 时 间 会 被 记录 下 来 , 当 文 件 被 恢复 的 时 想 ,希望 文件 的 这 些 时 间 与 原来 的 相同 ,这 时 候 
就 可 以 用 utinte。 恢 复 时 做 了 两 件 事 ,- 一 是 把 备份 的 文件 复制 回去 ,二 大 把 最 后 收 改 时 间 和 
访问 时 间 改 成 备份 时 候 的 情况 ,这样 被 恢复 的 文件 就 与 备份 时 的 完全 一 样 ， 

(2) 用 命令 修改 最 后 修改 时 间 和 最 后 访问 时 间 

shell 命令 touch 可 以 修改 文件 的 最 与 访 癌 时 间 和 最 后 修改 时 间 , 详 细 的 信息 参见 联机 
T gi. 


3.9.7 文件 名 


创建 文件 时 会 指定 一 个 文件 名 ,命令 mv 可 以 改变 一 个 文件 的 名 字 ,; 也 可 以 把 文件 从 -一 
个 地方 移 动 到 另 一 个 地 方 ， 

(OD 文件 名 的 建立 

系统 调用 creat 在 指定 文件 模式 的 同时 会 指定 文件 的 名 字 。 
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《2) 收 改 文件 名 
系统 调用 rename 可 以 修改 文件 /目录 的 名 字 , 还 可 以 移动 文件 的 位 置 , 它 有 两 个 参数 ， 
I x ERU X EE. 
rename 
目标 修改 文件 名 或 称 动 文 件 的 位 置 
头 文 件 # include «stdio. h> u 
图 数 原型 m int result = rename( char æ old, char * new ) 
参数 old 原来 的 文件 名 或 目录 名 
new An B X Ur Xx Bu 
"TI -1 SARE 
0 成 功 返 回 
AL 结 
1. 主要 内 容 


* 


2. 


磁盘 上 有 文件 和 目录 ,文件 和 目录 都 有 内 容 和 属性 。 文 件 的 内 容 可 以 旦 任意 的 数据 ， 
日 录 的 内 容 只 能 是 文件 名 /7 子 月 录 名 的 列表 。 

目录 中 的 文件 名 / 子 目 录 名 指 癌 文件 和 其 他 的 目录 ,内 核 提供 了 系统 调用 来 读 取 目录 
的 内 容 . 读 取 和 修改 文件 的 属性 。 

文件 类 型 ,文件 的 访问 权限 和 特殊 属性 被 编码 存储 在 一 个 16 位 整数 中 ,可 以 通过 撩 
码 技术 来 读 取 这 些 信息 

文件 所 有 者 和 组 信息 是 以 ID 的 形式 保存 的 ,它们 与 用 户 名 和 组 名 的 联系 保存 在 
passwd 和 group 数据 库 中 ， 

进一步 的 问题 


以 本 章 可 以 知道 目录 的 内 容 是 文件 和 名 和 目录 名 的 列 宕 ,目录 被 互相 连接 组 成 一 棵 树 , 它 
位 是 如 何 连 在 一 起 的 ? 下 一 章 会 对 目录 的 结构 做 详细 的 介绍 。 


3. 


图 示 


Be. AR EME TTA m EE 3.7 所 示 。 


4, 


习题 


3.1 JE struct dirent 中 ,数组 d name[ ] 的 长 订 在 有 的 系统 上 是 1: 而 在 有 的 系统 上 是 


255 ,实际 的 长 度 是 多 少 ? 为 什么 会 有 这 些 不 同 ? 为 什么 不 定义 成 char * ? 


3.2 文件 保护 模式 ------ rwx 可 以 通过 命令 chmod 007 filename 得 到 ,虽然 这 种 做 法 


很 奇怪 ,但 却 是 合法 的 ,其 他 用 户 对 文件 有 全 部 权限 ,组 用 户 和 文件 所 有 者 都 没有 
给 性 何 报 限 。 对 于 这 样 的 文件 ,人 谁 可 以 读 ? 当 内 核 执行 open 时 ,采用 的 是 什么 敢 
辑 来 判断 是 否 可 以 执行 ? 通过 实验 来 验证 自己 的 想法 ,如 果 可 以 看 到 内 核 的 代 
CO ELESSE 
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E 普通 文件 
83.2. 磁盘 上 有 目录、 文件 及 它们 的 属性 


每 个 用 户 都 有 用 户 名 .每 个 用 户 名 都 有 对 应 的 用 户 ID, EA RATA HAR 
名 对 应 一 个 相同 的 1D? 是 否 允 许 同 一 个 用 户 拥 有 两 个 不 同 的 ID? MRA root 权 
限 , 可 以 试 一 试 ,创建 两 个 用 户 , 改 成 同一 个 ID, 但 有 不 同 的 用 户 名 和 密码 。 这 两 
个 用 户 是 否 可 以 修改 对 方 的 文件 ? who 输出 什么 ”1s -1 输出 什么 ”命令 id f& t 
什么 ? 相互 发 送 email UE? 从 中 能 够 看 出 些 什 么 ? 多 个 用 户 使 用 同一 个 ID 还 有 
什么 其 他 用 途 ? 


与 曾 遂 的 文件 一 样 ,目录 也 有 特殊 属性 位 ,其 中 包含 set-user- ID M set- group- 
ID 位 ,使 set-user-JD 有效 对 目录 有 什么 影响 ? 如 果 有 ,那么 是 什么 ? 为 什么 ? 
如 果 没 有 影响 ,那么 你 能 想象 出 这 些 位 有 什么 作用 吗 ? 


每 个 文件 的 执行 权限 都 可 以 被 打开 或 关闭 ,假设 一 个 纯 文本 文件 具有 执行 权限 ， 
它 是 否 可 以 被 执行 ” 和 如果 一 个 包含 可 执行 代码 的 文件 ,如 对 CC 语言 编译 后 的 可 执 
行文 件 a. out, 没 有 执行 权限 的 话 , 它 是 否 可 以 被 执行 ? 讨论 执行 权限 和 可 执行 代 
码 之 间 的 区 别 。 它们 之 间 有 关系 吗 ? 参见 命令 file HRB B. 


STAP RAR P SAAR ID, 这 可 以 被 认为 是 两 种 标识 系统 ,为 什么 要 这 样 ? 
能 不 能 直接 用 用 户 名 来 表示 文件 所 有 者 ? ATA? 能 不 能 只 用 其 中 一 种 标识 系 
统 ? 珊 套 表示 系统 有 什么 优 缺 点 ”如 果 由 你 来 设计 系统 ,你 会 如 何 设计 ? 


命令 dirent 的 联机 帮助 中 所 到 了 系统 调用 getdents《2), 它 的 功能 是 什么 ? 与 
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readdir 有 和 什么 关系 ? 


ft 1s-1 的 输出 中 有 这 样 一 项 drwxr-xr-x; 表 示 这 是 一 个 目录 , 它 的 文件 所 有 者 
有 全 部 权限 ,组 用 户 和 其 他 用 户 只 有 读 和 执行 的 权限 。 对 于 文件 而 言 ,执行 权限 
意味 着 计算 机 可 以 执行 其 中 包含 的 机 器 代码 或 脚本 语句 ,对 于 目录 而 言 ,执行 权 
限 有 什么 意义 ?可 以 用 chmod 来 美 掉 这 个 自 录 的 执行 权限 ,看 看 会 故 生 什么 。 


3.9 ”用 户 是 通过 终端 或 终端 模拟 程序 登录 到 系统 中 的 , 终 问 设备 文件 位 于 /dev 目录 


下 ,输入 1s 一 1 /dev/tty * | more, 显 示 出 所 有 的 终端 设备 文件 的 详细 信息 ,与 普通 
文件 一 样 ,终端 设备 文件 也 有 文件 所 有 者 ,就 是 在 这 个 终端 登录 的 用 户 ,无 用 户 使 
用 的 终端 设备 的 文件 所 有 者 是 root, 

终 员 设备 文件 的 文件 所 有 者 被 login 程序 所 改变 ,查看 login BOR CES. Te S E 
文件 所 有 者 的 部 分 。 当 用 户 注销 时 ,终端 没 备 的 文件 有 所 有 者 会 被 改 回 上 成 toot, 是 
哪 -… 个 程序 改变 文件 所 有 者 的 ? 


5. 编程 练习 


5. 10 


为 了 将 分 栏 输出 的 功能 加 入 到 181. c 中 ,观察 标准 的 js 的 输出 ,发 现 每 一 栏 的 宽 
度 是 由 这 一 栏 最 长 的 文件 名 决定 的 ;而 且 显 东 的 栏 数 还 受 终 高 显示 作 的 宪 度 影 
啊 , 每 一 列 羡 可 能 的 等 党 。 这 是 如 何 实 现 的 ? 


前 面 提 到 182. c 无 法 处 理 在 命令 行 给 出 月 录 作 为 参数 (1s2 /tmp) ,修改 182. c 使 之 
能 够 处 理 。 


修改 ls2.c, 使 之 能 够 正确 显示 文件 特殊 属性 suid, sgid 和 sticky, B S EK OLAF Bh 
确保 程序 能 处 理 各 种 情况 。 


使 用 标准 的 cp 时 ,如 果 第 二 个 参数 是 目录 ,那么 会 把 第 一 个 参数 指定 的 文件 复制 
A A OA H oe F 4N: 

$ ep filel ‘tmp 
等 价 于 ， 

S cpfilel /tmp/filel 


修改 第 2 章 的 cpl.c f Z BESE SE m LATHE. 


有 时 需要 对 整个 目录 作 备 纷 ,修改 cpl. c 使 得 当 两 个 参数 都 是 目录 时 ,把 第 一 个 
目录 中 的 所 有 文件 复制 到 第 二 个 目录 中 ,文件 名 不 变 。 


修改 ls1. c 使 得 它 能 够 将 文件 排序 后 输出 。 标 准 的 Is 支持 选项 -1, 它 的 作用 是 
逆序 输出 ,把 这 项 功能 也 加 入 到 Isl.c 中 。 有 些 版 本 的 ls 支持 选项 -gq, 它 的 作用 
是 不 排序 箱 出 , 当 目 录 中 的 文件 特别 多 的 时 候 , 可 以 加 快 ls 的 输出 速度 。 


有 一 个 目录 , 它 的 许可 权限 为 rwxr 一 x 一 一 x; 写 出 对 应 的 st. mode 的 二 进 制 
形式 。 
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n X — P E EA ARN RE TT SP OCA OE dE. OR Pe i HT 
开 一 个 文件 ,保持 文件 的 打开 状态 ,然后 从 另外 的 终 问 登录 ,去 掉 文件 的 读 权 限 ， 
这 时 有 什么 事情 会 发 生 ? 编写 一 个 程序 , 先 用 open() 打 开 一 个 文件 ,有 几 read Oi 
一 些 内 容 , 调 用 sleep(20) 等 等 20 s 以 后 ,再 读 一 些 内 容 , 从 另外 的 终端 ,在 等 待 的 
20 s 内 去 掉 文 件 的 读 权 限 ,这 样 会 有 什么 结果 ? 


标准 的 ls 支持 选项 -R, 它 的 功能 是 网 归 地 列 出 卢 录 中 所 有 的 文件 包 会 子 目 录 中 
的 文件 ，。 侯 改 1s2.c, 使 之 支持 这 一 功能 。 


标准 的 ls 文 持 选项 ~-u, 它 会 显示 出 文件 的 最 后 访问 时 间 , 如 果 用 了 一 u 而 不 用 一 
1, 会 有 什么 结果 ?修改 ls2 e 使 之 支持 这 一 功能 。 提 示 : 读 -t 选项 的 内 容 。 


目 己 编写 一 个 chown, 使 之 能 够 接收 内 户 名 或 用 户 ID 作为 参数 ,能 够 一 次 修改 多 
个 文件 的 文件 所 有 者 。 考 虑 以 下 问题 ,如 何 将 文件 各 转换 为 用 户 ID? 如 果 用 户 
dA ETE T IM 提示 ; 要 测试 这 个 程序 ,可 能 需要 管理 员 的 权限 。 


在 做 文件 恢复 的 时 候 , 不 仅 希 望 将 文件 恢复 ,还 希望 将 文件 的 最 后 修改 时 间 和 最 
后 访问 时 间 恢 复 ,编写 cp 来 实现 上 述 要 求 。 


可 以 通过 终 问 设备 文件 来 与 用 户 收发 数据 ,如 程序 从 这 个 文件 读数 据 ,就 等 于 从 
者 户 的 键盘 读数 据 , 写 数 据 就 等 十 将 数据 显示 在 屏幕 上 。struet stat 中 的 成 员 变 
f st mtime 记录 了 文件 最 后 修改 时 间 ,编写 程序 lastdata 列 出 每 个 用 户 的 中 汤 
设备 文件 的 最 后 修改 时 间 , 输 出 格式 参照 who. 


6. 项 目 
根据 本 章 所 学 的 内 容 , 可 以 编写 以 下 的 Unix 程序 : 


chmod,file,chown,chqrp.finger,.touch 
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概念 与 技巧 

。 Unix 树 状 文件 系统 的 概念 

> Unix 文件 系统 的 内 部 结构 ; i- 节 点 和 数据 块 
* 目录 的 连接 方式 

€ RAIT SEE HUP ACTES HS 8 FH 
* pwd 的 工作 原 埋 

© CE A BEY A (mounting) 

相关 系统 调用 

s mkdir,rmdir,chdir 

* link, ualink,rename symlink 

fH Oc fp S 

* pwd 


4.1 介 2H 


文件 包 会 数据 ,而 日 录 是 文件 的 列表 。 不 同 的 目录 互相 连接 构成 树 状 的 结构 。 上 自 录 还 
可 以 包含 其 他 的 日 录 。 文 件 “ 在 一 个 目录 中 "是 什么 意思 呢 ” 当 登录 到 一 台 Unix 的 机 器 上 ， 
可 以 说 你 处 在 "你 的 主 上 日 录 中 ” ,一 个 人 “处 在 茶 个 目录 中 ”又 是 什么 意思 呢 ”? 

树 状 结构 像 是 一 个 神话 。 一 个 砚 盘 实际 上 蚌 由 一 些 金属 圆 盘 构成 的 ,每 个 盘面 上 部 有 
磁 人 性 物质 ， 这 些 金属 盘 如 何 显示 为 一 个 包 浓 文件 .属性 和 目录 的 树 状 结构 呢 ? 

为 回答 这 些 问 题 需 要 编 与 目 己 的 pwd 命令 。pwd 显示 你 在 目录 树 中 的 当前 位 置 。 从 树 
根 到 你 所 处 位 置 所 经 过 的 目 尖 的 序列 被 称 做 路 径 (path) 。 要 编写 pwd, 必 须 了 解 文件 和 目录 
是 如 何 组 织 和 存储 的 。 本 章 将 先 察看 文件 系 统 的 外 在 特征 . 接 下 来 分 析 它 的 内 部 结构 ,最 后 
学 习 相 应 的 系统 调用 的 功能 和 使 用 方法 。 
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4.2 从 用 户 的 角度 看 文件 系统 


4.2.1 具 录 和 文件 


从 用 户 的 角度 来 看 ,Unix 系统 中 硬盘 上 的 文件 组 成 一 棵 目录 树 。 每 个 目录 能 包含 文件 
或 其 他 的 目录 。 图 4.1 是 树 的 一 个 示例 。 

下 面 将 从 构建 这 个 目录 结构 开始 ,介绍 管 
理 这 些 文 件 和 目录 树 的 Unix fg. 


4.2.2 目录 前 令 


HT VATERS T a ir NU FRI AE A 
Bit on B3 ER ER AF : 


$ mkdir demodir 
$ od demodir 
$ pad 


/ home / yourname/exper iments/demodir 


demodir 





S mkdir b cops 

g mv bc 

S rmdir cops 

$ cdc 

s mkdir di d2 

$ od ,../,. 

5 mkdir denodir/a 


其 实 要 达到 同样 的 效果 ,本 可 以 使 用 大 于 其 他 的 命令 ,这 里 为 了 演示 而 故意 做 得 复杂 些 . 

按照 上 面 的 例子 建立 这 棵 树 。 例 子 中 使 用 了 一 些 基 本 的 命令 ,mkdir 用 来 创建 一 个 指定 
的 目录 或 多 个 目录 。 思 考 以 下 问题 ,创建 一 个 和 已 有 文件 或 目录 同名 的 目录 将 会 怎样 ? 
rmdir 用 来 删除 一 个 目录 或 多 个 目录 ,删除 一 个 包含 子 目 录 的 自 录 会 发 生 什 么 事 呢 ?mv 用 
来 重 命名 一 个 目录 ,也 可 用 来 将 一 个 县 录 从 一 个 地 方 物 到 另 一 个 地 方 。 

与 上 上 述 命 邻 不同 的 是 cd 命令 不 对 目录 产生 影响 , 它 影响 的 是 用 户 。cd 使 你 从 一 个 日 录 
转 到 男 一 个 日 录 , 就 如 间 你 从 一 个 房间 走 到 另 一 个 房间 。pwd 打印 出 当前 工作 上 自 录 。 在 上 
面 的 例子 中 ，、demodir 是 experiments 的 一 个 子 旧 录 ,而 experiments 位 于 yourname 之 下 ， 
yourname 位 于 home 之 下 ,home 位 于 根 目录 之 下 , 根 目 录用 */ 浇 示 。 


4.2.3 文件 操作 命令 
现在 在 这 棵 目录 树 中 创建 一 些 文件 : 


S cd demodir 
S5 cp /eto/group x 


5 cat x 


» 08 > Unix/Linux #BE RAE 


root; :0: 
bin::1-bin, daemon 
users: 200; 

$ cp x copy. of. x 

S mv copy. of. x y 

$ ede 

5 cp../a/zx d2/xcopy 
5 ln.,/a/z di/xlink 
S ls — dl/xlink 

5 cp dl/xlink z 

5 rm../../demodir/c/d2/../z 


S cat demodir /a/x 
《 想 想 接着 会 显示 出 什么 ?) 


为 了 演示 各 种 文件 操作 命令 ,特意 设计 了 上 述 命 令 操 作 序 列 , 请 按照 上 面 的 步骤 和 目 己 建 
立 文 件 , 想 一 下 最 后 一 个 命令 会 产生 怎样 的 结果 。 这 个 例子 中 用 了 一 些 最 常用 的 文件 处 理 
fr. cp 用 来 复制 一 个 文件 ,在 前 面 的 章节 中 已 经 编写 了 一 个 cp 的 简易 版 本 。eat 命令 将 
文件 内 容 复制 到 标准 输出 文件 。myv 命令 可 以 重合 名 一 个 文件 ,就 像 在 党 一 个 例子 中 那样 
也 可 将 文件 移动 到 另 一 个 目录 ,就 像 在 第 二 个 例子 中 那样 。rm 命令 删除 一 个 文件 ,请 注意 目 
录 路 径 可 能 包含 “. . “及 多 个 目录 元 素 。 符 号 ”. “表示 上 一 级 日 录 , 即 父 目 起。 一 系列 用 症 
斜 杠 分 页 的 目录 名 指出 了 能 到 达 指 定 对 象 的 一 条 路 经 ,注意 此 时 并 林 改 变 用 户 所 处 的 位 置 ， 
上 例 中 采用 这 种 间接 的 方法 删除 了 文件 z”。 


demodir 





4,2 对 同一 文件 的 两 个 链接 


文件 的 复制 .显示 文件 的 内 容 和 重 命 名 是 任何 计算 机 系统 都 会 提供 的 操作 ,向 命 令 ln 则 
不 是 很 常见 ,但 它 却 是 Unix 的 一 个 基本 操作。 如 在 上 例 中 生成 了 对 一 个 已 存在 文件 . . /ayx 
的 一 个 链接 ,这 个 链接 称 为 di/ xlink。 如 图 4.2 所 示 , 称 为 x 的 项 位 于 目录 demodiz/a 中 , 称 
为 xlink 的 项 位 于 目录 demodir/c/dl P. x 和 xtink 都 称 为 链接 ， 一 个 链接 量 指 向 文件 的 一 
个 指针 。.. /a/x Al dl/xlink 都 指向 硬盘 上 同一 数据 块 。 上 例 中 .下 一 个 命令 ls  dl/xlink 
将 is 的 输出 作为 文件 xlink AAA. AGA SEAS cat.. /a/x 时 将 会 发 生 什 么 呢 ? 
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4.2.4 针对 目录 树 的 命令 
有 些 Unix 命令 是 对 整个 树 结 构 进 行 操 作 ,以 下 是 一 些 例子 : 
ls -R 


ls 命令 用 来 列 出 月 录 的 内 容 , 选 项 -R 要 求 列 出 指定 自 录 及 其 子 目 录 的 所 有 内 容 。 企 前 
面 的 章 季 中 已 经 给 出 了 一 个 is 的 版 本 ,但 要 完成 选项 -R 要 求 的 功能 ,还 需要 做 一 些 工作 。 


chmod — R 


chmod 命令 用 米 修 改 文件 的 许可 权限 位 ,选项 -人 R 要 求 修改 子 目 录 中 所 有 文件 的 许可 
PUR 


du 


du 是 disk usage( 硬 盘 使 用 ) 的 缩写 ,该 命令 给 出 指定 昌 录 及 其 子 自 录 下 所 有 文件 占用 硬 
生 中 数据 块 的 总 数 。 


find 


find 命令 将 在 一 个 日 录 及 其 所 有 子 日 录 中 检索 符合 要 求 的 文件 和 目录 。 例 如 ,可 以 检索 
一 柠 晶 录 树 中 所 有 大 于 1MB.、 上 周末 被 修改 过 .可 被 所 有 用 户 阅 读 的 文件 。 

Unix 中 目录 树 是 文件 系统 的 一 个 重要 组 成 部 分 ,其 他 有 很 多 命令 都 跟 目 录 树 有 关 :读者 
可 以 自己 试 奢 找 一 找 。 


4.2.5 自 录 树 的 深度 几乎 没有 限制 


目录 能 够 包含 多 个 文件 和 子 自 录 。 系 统 并 未 对 目录 树 的 深度 加 以 限制 。 但 是 ,有 可 能 
所 建 的 目录 树 太 深 以 至 超过 许多 命令 允许 的 范围 。 

注意 : 如 果 你 想 尝 试 以 下 的 试验 ,请 在 自己 的 机 器 上 做 。 如 果 在 学 校 或 工作 地 点 进行 试 
验 ,那里 的 系统 管理 员 青 定 会 不 高 兴 。 

这 是 一 个 简单 的 命令 脚本 (关于 脚本 的 解释 详 见 第 8 BE), 


while true 

do 
mkdir deep 一 well 
cd deep — well 


done 


即使 你 在 程序 运行 1.2 秒 后 就 按 下 Ctrl-C, 它 也 会 创建 一 个 非常 深 的 级 联 目录 树 。 那 
么 du 作 令 对 这 个 级 联 日 录 会 产生 什么 效果 ? find 和 ls -及 命令 又 会 如 何 呢 ? 

在 Unix 的 很 多 版 本 中 ,下 述 命 令 rm -r deep -wel 将 不 起 作用 ,考虑 一 下 如 何 才 能 删 
E fl c DE) H S Fy 
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4.2.6 Unix 文件 系统 小 结 


这 个 小 节 中 从 由 户 的 角度 观察 了 Unix 的 文件 系统 。 硬 盘 上 呈现 了 一 个 能 够 在 深度 和 
觉 度 上 广泛 延伸 的 目录 树 结构 ,Unix 提供 了 很 多 命令 来 和 这 种 结构 的 对 象 协 同 工 作 。Unix 
系统 中 的 所 有 文件 都 存在 于 这 种 结构 中 ， 

它们 是 如 何 工 作 的 ? 目录 是 什么 ?” 如何 知 道 文件 所 处 的 目录 ? 从 一 个 目录 转换 到 万 一 
个 旨 录 意味 着 什么 ? pwd 如 何 得 知 你 当前 所 处 的 位 置 ? 这 些 问题 将 引导 下 面 的 学 习 。 


4.3 Unix 文件 系统 的 内 部 结构 


鲁 盘 实际 上 是 由 一 些 磁性 盘 片 组 成 的 计算 机 系统 的 一 个 设备 。 前 面 章 节 中 所 旬 及 的 文 
件 系 统 是 对 该 设备 的 一 种 多 层次 的 抽 租 。 


4.3.1 第 一 层 抽 象 : 从 磁盘 到 分 区 


一 个 态 盘 能 够 存储 大 量 的 数据 ， 就 像 一 个 国家 能 被 划分 成 州 或 县 ,一 个 磁盘 可 被 划分 
成 分 区 ,以 便 在 一 个 大 的 实体 内 创建 独立 的 区 域 。 每 个 分 区 都 可 以 看 作 是 一 个 独立 的 磁盘 ， 


4.3.2 第 二 层 抽 象 : AS SP 


一 个 硬盘 由 一 些 屠 性 盘 片 组 成 ,每 个 盘 片 的 表面 都 被 划分 为 很 多 同心 圆 ,这 些 同 心 顺 
PRAE REGE ,每 个 硫 道 又 进一步 被 划分 成 扇 区 ,就 像 郊 外 的 街道 被 划分 成 居住 单元 。 每 个 屏 区 
可 以 存储 一 定 字 节 数 的 数据 ,例如 每 个 局 区 有 512 字 节 。 和 扇 区 是 破 盘 上 的 茜 本 存储 单元 , 现 
在 的 磁盘 包含 大 量 的 扇 区 ， 图 4.3 Ra ORAS EMT ACR RRA. 


Vs SY SBIR A; 
EAS. t 
HEARE 
来 像 一 个 数 
组 








01234567 89101].... 


图 4.3 为 数据 块 分 配 编 号 


为 磁盘 块 编号 是 一 种 很 重要 的 方法 。 给 每 个 磁盘 块 分 配 连 续 的 编号 使 得 系统 能 够 计算 
磁盘 上 的 每 个 块 。 可 以 一 个 厂 盘 接 一 个 破 盘 地 从 上 到 下 给 所 有 的 块 编 号 ,还 可 以 一 个 磁道 
接 一 个 磁道 地 从 外 向 里 给 所 有 的 块 编号 。 就 像 给 每 条 街道 上 的 每 所 房子 编号 一 样 ,磁盘 上 
存储 数据 的 软件 给 磁盘 上 每 条 磁道 上 的 每 个 块 分 配 了 一 个 序号 。 

一 个 将 磁盘 遍 区 编号 的 系统 使 得 我 们 可 以 把 磁盘 视 为 一 系列 块 的 组 合 。 


4.3.3 第 三 层 抽象 : 从 块 序列 到 三 个 区 域 的 划分 
文件 系统 可 以 用 来 存储 文件 内 容 、 文 件 属性 (文件 所 有 者 \ 日 期 等 ;和 目录 ,这 些 不 同类 
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型 的 数据 是 如 何 存储 在 被 编号 的 磁盘 抉 上 的 呢 ? 
Unix 使 用 了 一 个 简单 的 方法 。 如 图 4.4 所 示 , 它 将 这 些 磁盘 块 分 成 了 3 部 分 。 


BEAR iX PZN 








"| EEEE S 
属性 存储 在 这 里 内 空 革 储 在 这 里 
84.4 文件 系统 的 三 个 区 域 





一 部 分 称 为 数据 区 ,用 来 存放 文件 内 容 。 另 一 部 分 称 为 i- 节 点 表 (inode table), 用 来 存 
放 文 件 属 性 。 第 三 部 分 称 为 超级 块 (superblock) .用 来 存放 文件 系统 本 身 的 信息 。 文 件 系 统 
由 这 3 部 分 组 会 而 成 ,其 中 任 一 部 分 者 是 由 很 多 有 序 磁 盘 块 组 成 的 。 

(1) BAR 

文件 系统 中 的 第 一 个 块 被 称 为 超级 块 。 这 个 块 存 放 文 件 系统 本 身 的 结构 信息 例如. 
超级 块 记录 了 每 个 区 域 的 大 小 。 超级 块 也 存放 未 被 使 用 的 磁盘 块 的 信息 。 不 同 版 本 Unix 
的 超级 块 的 内 容 和 绪 构 稍 有 不 同 .可 以 察看 联机 帮助 和 头 文件 .以 确定 你 的 系统 的 超级 块 所 
. 包含 的 内 容 。 

(2) i- 节 点 表 

文件 系统 的 下 一 个 部 分 被 称 为 i~ 节 点 表 。 每 个 文件 都 有 一 些 属性 ,如 大 小 、 文 件 所 有 者 
和 最 近 修 改 时 间 等 。 这 些 性 质 被 记录 在 一 个 称 为 1- 节 点 的 结构 中 。 所 有 的 I-AA 
同 的 大 小 ,并 且 1 节点 表 是 这 些 结构 的 一 个 列表 。 文 件 系统 中 网 每 个 文件 在 该 表 中 都 有 一 
个 i~ 节 点。 如 果 你 有 root 权限 ,就 可 以 像 操作 文件 一 样 将 分 区 打开 . 疝 读 并 显示 1- 节点 表 ， 
在 显示 utmp 文件 时 就 用 过 类 似 的 技术 ， 

以 下 这 一 点 很 重要 ; 表 中 的 每 个 1 节点 都 通过 位 置 来 标识 。 例 如 ,标识 为 2 的 ji 一 节点 
(inode 2) 位 于 文件 系统 i- 节点 表 中 的 第 3 个 位 置 。 

(3) 数据 区 

文件 系统 的 第 3 个 部 分 是 数据 区 。 文 件 的 内 容 保 存在 这 个 区 域 。 故 盘 上 所 有 上 的 大 小 
部 是 一 样 的 。 如 果 文 件 包 含 了 超过 一 个 块 的 内 容 , 则 文件 内 容 会 存放 在 多 个 侯 盘 块 中 。 一 
个 较 大 的 文件 很 容易 分 布 在 上 二 个 独立 的 磁盘 块 中 。 那 么 ,系统 是 如 何 跟 踪 这 些 独 立 的 磁 
盘 块 呢 ? 


4.3.4 文件 系统 的 实现 : 创建 一 个 文件 的 过 程 


文件 的 内 容 和 属性 分 区 存放 的 想法 看 起 来 很 简单 ,但 实际 上 它 是 如 何 工作 的 呢 ? 创建 
一 个 新 文件 的 时 候 又 会 发 生 什 么 ? 考虑 以 下 命令 : 


S who > userlist 


当 这 个 命令 完成 时 ,文件 系统 中 增加 了 一 个 存放 命令 who 输出 内 容 的 新 文件 。 这 是 怎 
么 回 事 ? 
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i45 文件 的 内 部 结构 


创建 一 个 新 文件 的 4 个 主要 操作 如 下 。 

(1) 存储 属性 

文件 属性 的 存储 : 内 核 先 找到 一 个 空 的 ji- 节点。 图 4.5 中 ,内 核 找到 j- 节 点 47。 内 核 
把 文件 的 信息 记录 其 中 。 

(2) 存储 数据 

文件 内 雁 的 存储 : 由 于 该 新 文件 需要 3 个 存储 矿 盘 块 ,因此 内 核 从 自由 块 的 列表 中 找 出 
3 个 日 由 块 。 图 4.5 中 , 它 找 到 块 627.200 和 992。 内 核 缓 冲 区 的 第 一 块 数据 复制 到 块 627， 
下 一 块 数据 复制 到 块 200, 最 后 一 块 数据 复制 到 块 92. 

(3) ORs BO Tir A 

文件 上 内容 按 顺序 存放 在 块 627.200 和 992 中 .内核 在 i- 节 点 的 磁盘 分 布 区 记录 了 上 述 
的 块 序列 。 磁盘 分 布 区 是 一 个 磁盘 癸 序号 的 列表 ,这 3 个 编号 放 在 最 开始 的 3 个 位 置 。 

(4) 添加 文件 名 到 目录 

新 文件 的 名 字 是 userlist. Unix 如 何在 当前 的 目录 中 记录 这 个 文件 ? 答案 很 简单 。 内 
核 将 人 口 (47,userlist) 添 加 到 目录 文件 。 文 件 名 和 ! 一 节点 号 之 间 的 对 应 关系 将 文件 名 和 文 
件 的 内 容 及 属性 连接 了 起 来 。 这 个 问题 将 在 下 面 进一步 地 讨论 。 


4.3.5 文件 系统 的 实现 : 目录 的 工作 过 程 


日 怪 丰 一 种 包含 了 文件 名 字 列 表 的 特殊 文件 。 不同 版 本 的 Unix 目录 的 内 部 结构 不 同 ， 
但 是 它们 的 抽象 模型 总 是 一 致 的 一 一 一 个 包含 i- 节 点 号 和 文件 名 的 表 、 
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i 一 节点 号 文件 名 
2342 
43989 pa 
3421 hello, c 
533870 inyls. € 


(1) 探讨 日 录 内 部 
可 以 通过 命令 Is ~1iat 选 项 第 一 位 是 数字 1) 来 看 目录 的 内 容 : 


$ ls - lia denodir 
177865 . 

529193 .. 

288277 a 

200520 c 

204491 y 

? 


输出 的 是 文件 名 和 对 应 的 -节点 号 。 例 如 ,文件 各 y 对 应 于 i- 节 点 号 204491。 当 前 目 
RH“ "MR uc 节点 号 是 177865。 这 意味 着 有 关 太 小 ,文件 所 有 者 、 组 等 各 项 关于 当前 目录 
的 信息 存放 在 i- 节点 表 中 的 编号 为 177865 的 结构 中 。 

ls 的 选项 -i 和 -1( 数 字 1 而 不 是 字母 1) 可 能 有 点 陌生 。 选 项 -i 告诉 ls 在 列表 中 包含 i 
-节点 号 ,选项 -1 要 求 每 行列 出 一 个 文件 ,在 demodir 版 本 上 尝试 这 个 命令 ,以 查看 所 得 到 
的 1 一 节点 号 。 

(2) 指向 同一 文件 的 多 重 链接 

可 以 使 用 命令 ls -i 查看 系统 上 任何 一 个 文件 的 i- 节点 号 。 例 如 ,可 以 查看 系统 上 根 且 
录 中 各 文件 的 i- 节点 号 ; 


S ls -ia/ 
2 28673 etc il lost + found 438292  shlib 
2 .. 311297 home 4097 mnt 40961 tmp 
3 auto B832  home2 108545 opt 18433 usr 
26625 bin 24645  initrd 1 proc 10241 var 
403457 boot 24579 install 24681 root ^ 183 xfer. log 
225281 dev 161797 lib 233473 sbin 183 transfers 


这 个 列表 含有 两 个 重要 的 例子 。 第 一 ,在 右 下 人 角 有 被 称 为 xfer. log 和 transfers 的 两 个 
文件 。 这 两 个 文件 都 拥有 i 一 节点 号 183。 因 此 ,两 个 文件 都 指向 同一 个 i- 节点。i- 节 点 实 
际 上 代表 了 一 个 文件 ,1- 节 点 包含 了 文件 的 属性 和 数据 氛 的 列 囊 。 因 此 , xfer. log 和 
transfers 是 同 -- 个 文件 的 两 个 不 同名 字 。 这 有 点 像 电 话 短 里 的 两 个 不 同 的 电话 号 码 所 对 应 
的 电话 机 有 可 能 在 同一 所 房子 中 。 


四 电话 狂 的 比 嘛 不 是 完全 悦 当 ,内 为 两 个 相同 的 人 孝 可 能 住 在 那个 房子 。 请 在 网 络 编 得 章节 中 了 解 port 的 概念 。 


。 104 « Unix/Linux AARAA f 


在 很 且 录 中 另 一 个 重要 的 例子 是 左上 和 角 的 “. "fn." RRMA 17 Bam ZLBEATLT 
和 “. , ”都 指向 同一 个 目录 。 当 前 目录 怎么 会 和 父 只 录 相 同 呢 ?下 实际 上 在 大 多 数 情况 下 , 它 
们 是 不 同 的 , 根 且 采 比 较 特 别 , 当 用 Unix 命令 mkfs 创建 了 一 个 文件 系统 ,mkfs 将 根 目 录 的 
父 目录 指向 自己 。 


4.3.6 文件 系统 的 实现 ; cat 命令 的 工作 原理 


现在 已 经 看 到 了 创建 一 个 新 的 文件 时 内 部 所 发 生 的 事情 ,例如 who > userlist, 241i BY 
一 个 文件 时 又 会 发 生 什 么 呢 ?》 读 时 命令 如 何 工 作 ? RAP HY oe : 





5 cat userlist 


采用 从 目录 文件 一 步 一 步 找到 数据 的 方法 来 加 以 了 解 ， 

Cl) 在 目录 中 寻找 文件 名 

文件 名 存储 在 目录 文件 中 。 内 核 在 目录 文件 中 寻找 包含 字符 串 userlist f ia. 
userlist 所 在 的 记录 包含 编号 为 47 的 1- 节点 号 ,如 图 4,6 rm. 


$ cat userlist 







从 文件 名 到 文件 内 容 : 
在 目录 中 寻找 文件 名 
使 用 编号 定位 1 一 字 点 
i 节点 包含 数据 块 的 
列表 


4.6 ASCE a FE RI 


(2) 定位 ;~- 节 点 4? 并 读 取 其 内 容 

内 核 在 文件 系统 中 的 1- 节点 区 域 乒 到 i- 节点 47。 定 位 一 个 ;~ 节点 可 能 种 要 一 PT 
Wits BUB B3 17 7D ECAINAB [8] STHRRRAS HARRY 17 5 xx. AT Sess Urn 
率 , 内 核 有 可 能 将 ;- 节 点 填 于 缓冲 区 中 。i- 节 点 包含 数据 块 编号 的 列表 。 

(3) 访问 存储 文件 内 容 的 数据 块 

通过 以 上 过 程 ,内 核 已 经 可 以 知道 文件 内 容 存 放 在 哪些 数据 块 上 ,以 及 它们 的 顺序 。 出 
于 cat 不 断 地 调用 read 晒 数 ,使 得 内 核 不 断 将 字 节 从 磁盘 复制 到 内 核 缓冲 区 ,进而 到 达 用 户 
空间 ， 

所 有 从 文件 读 取 数据 的 命令 ,例如 cat、cp、more、wbho 等 ,部 是 将 文件 名 传 给 open 来 访 


(D E% Laiham & Jalfe fi 2E i) Im My Own Grandpa. 1947 对 相关 主题 的 讨论 ， 
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问 文件 内 容 。 对 open 的 每 次 调用 都 是 先 在 目录 中 寻找 文件 名 ,然后 根据 目录 中 的 i- 节 点 号 
获得 文件 的 属性 ,最 终 找 到 文件 的 内 容 ， 

现在 可 以 想象 一 下 在 open 一 个 没有 读 或 写 权 限 的 文件 时 将 发 生 什么 情况 。 内 核 首 先 根 
据 文件 名 找到 i- 节点 号 ,然后 根据 -节点 号 找到 i- 节点。 在 i- 节点 中 ,内 核 找 到 文件 的 权 
限 位 和 拥有 者 的 用 户 TD。 如 果 权 限 位 设置 你 的 用 户 ID 对 文件 没有 访问 权限 , 则 open 返回 
一 1 Jt EK Eja% fit errno fj (ity EPERM, 

通过 对 目录 .i- 节 点 和 数据 块 的 描述 ,相信 能 提高 对 其 他 的 文件 操作 的 理解 。 可 以 通过 


阅 污 一 些 版 本 的 Unix 系统 源 代码 来 加 以 检验 。 
4.3.7 1 一 节点 和 大 文件 


Unix 文件 系统 如 何 跟踪 大 文件 呢 ” 其 实 前 一 个 章节 中 的 解释 并 不 完整 。 简 短 地 说 , 问 
BE. 


事实 | —A X BI] MH ES Tt RR 
事实 2 在 -节点 中 存放 有 发 盘 块 分 配 列 表 
问题 一 个 固定 大 小 的 i- 节点 如 何 存储 较 长 的 分 配 列表 ? 
解决 方案 将 分 配 列 表 的 大 部 分 存储 在 数据 块 .在 i- 节点 中 存放 指向 那些 块 的 指针 。 


考虑 图 4.7 中 描述 的 解决 方案 。 这 个 文件 霸 要 14 个 数据 块 存储 它 的 内 容 。 因 此 ,分 配 
链表 包含 14 个 块 的 编号 。 但 是 很 超 银 ,文件 的 i- 节点 只 包含 一 个 含有 13 个 项 的 分 配 链 表 ， 
14 个 编号 如 何 放 到 13 个 项 中 呢 ? 其 实 很 简单 。 将 分 了 配 链表 中 的 前 10 个 编号 放 到 ji- 节点 
中 ,将 最 后 4 个 编号 放 到 一 个 数据 抉 中 。 这 有 点 像 把 某 些 货物 放 在 架子 上 而 把 剩 下 的 放 在 仓 
库 里 。 

更 具体 地 说 ,就 是 该 !- 节点 的 链表 包含 分 配 13 个 块 编号 的 空间 ,链表 里 的 前 10 个 项 像 
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13 个 块 编号 的 矩阵 
S [8 FRR 
À IX 
$: A. 
TN | 块 13 存 储 荐 包 
从 = 
ee Ww 全 更 多 二 级 同 
AAA ERU VR 
se | /| (| /| | I^] | A] 的 编号 。 这 个 
SEIRA- 节 ”分 配 列表 在 间接 ” 块 12 存 储 着 包含 纲 多 MRR. 


点 出 表 中 的 前 10” 映 中 继续 . Rar ”向 接 块 的 那个 数据 块 
THH 存储 着 那个 块 的 ”的 和 编号. 这 个 块 波 称 
编号 : S — quu. 


: Al 4.7 在 数据 区 延伸 的 块 分 配 列表 
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—— — m _ om =. — ——n EMT — mE 
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‘ha Y. 2z [B] "-——34€ 3p 10 Am p p i SHA RE. un SR BOSE RUN ET 
10 个 的 项 ,由 剩 下 的 块 编 另 不 是 存储 在 i- 节点 :而 是 存储 在 数据 区 。 存 放 多 余 编 号 的 数据 
块 的 编号 存储 在 i- 节 点 的 第 11 个 项 中 一 一 就 像 书店 里 有 个 使 条 贴 在 架子 上 写 背 剩 下 的 货 
牧 在 仓库 的 3 SAT EU. 

注意 到 这 个 文件 实际 上 用 了 15 个 数据 块 。 其 中 14 个 用 来 存储 文件 的 内 容 ; 剩 下 的 1 个 
ERE i- 节 点 的 分 本 链表 庞 法 三 让 的 闭 部 分 内 容 。 这 个 额外 的 块 被 称 为 辐 接 块 。 

(1) 间接 块 饱 和 时 如 何 处 理 ? 

当 越 来 越 多 的 字 节 被 添加 至 文件 ,内 核 将 分 配 更 密 的 数 擂 块 , 因 此 分 配 列表 越 来 越 长 ， 
需要 更 多 的 存储 空间 。 分 配 列 表述 时 会 充满 间接 块 ,所 以 内 核 将 开始 引入 第 二 个 额外 块 。 
内 核 将 如 何 处 理 第 二 个 额外 块 的 块 编号 ”内 核 需 将 第 二 个 间接 块 的 编号 放 入 i 一 书 点 的 第 12 
个 项 中 吗 ? 可 以 这 么 做 ,但 是 这 样 意 昧 着 文 件 仪 能 含有 3 个 额外 块 。 实 际 上 ,内 核 并 不 把 第 
二 个 额外 块 的 编导 放大 1 竹 点 ,取而代之 的 是 ,内 核 开 和 辟 另 外 一 个 块 来 存放 这 些 额外 间接 块 
的 列 洪 。1i 一 节点 的 第 12 项 并 不 存放 第 二 个 额外 块 的 编写 ,而 是 存放 却 个 存储 着 第 2、3、4 太 
后 继 额 外 块 的 编号 的 块 的 编号 。 这 个 块 被 称 为 二 级 间接 块 ， 

(2) 二 级 间接 块 饱 和 堵 如 何 处 理 ? 

当 二 级 间接 块 饱 和 时 ,内 核 开 辟 另 一 个 新 的 二 级 同 接 央 。 内 核 并 不 把 这 个 新 的 间接 二 
级 块 的 编号 放 人 i 一 节点 的 列表 。 而 是 创建 一 个 三 级 间接 块 来 存放 二 级 间接 块 的 编号 以 及 这 
个 文件 将 来 所 需要 的 所 有 间接 二 级 块 的 编号 。i 一 节点 列表 的 最 后 一 项 正 是 记录 着 这 个 三 级 
间接 块 的 编号 。 

(3) 二 级 问 接 块 伯 和 时 又 将 如 何 处 理 ? 

文件 到 达 了 极限 。 如 果真 想 使 用 大 文件 ,可 以 创建 一 个 由 更 大 的 磁盘 块 构成 的 文件 系 
统 。 当 创建 该 文件 系统 时 ,不 仅 能 够 定义 i- 节点 表 和 数据 区 的 大 小 ,而 且 能 够 定义 磁 扒 块 的 
大 小， 磁盘 所 并 不 需要 和 磁盘 证 区 同样 大 小 ,通常 一 个 磁盘 块 包 含 若 干 个 肩 区 。 

由 于 大 文件 的 存储 管理 需要 更 多 的 开销 ;因此 这 样 的 磁盘 分 配 系 统 对 小 文件 来 说 是 快 
捷 高 效 的 。 妆 文件 逐步 增长 时 ,内 核 使 用 更 多 的 磁盘 空间 去 维护 越 米 越 长 的 分 配 列 表 。 在 
文件 中 定位 一 个 特定 的 位 置 可 能 需要 获取 若干 个 间接 块 以 得 到 数据 块 的 编号 。 


4.3.8 Unix 文件 系统 的 改进 


前 一 小 节 搞 述 了 Unix 文件 系统 的 结构 。 AIR) CS B Unix 使 用 这 种 模型 的 不 同 版 本 。 
这 个 经 典 的 简洁 方法 有 些 严 重 的 不 足 之 处 。 例 如 ,超级 块 就 是 一 个 问题 。 如 果 这 个 块 损坏 
了 ，, 则 整个 文件 系统 的 结构 信息 就 没有 了 ,新 版 本 的 Unix 在 文件 系统 中 备份 了 这 个 块 的 
副本 。 

分 块 是 男 一 个 问题 。 由 于 交 件 的 创建 和 删除 ,自由 块 将 遍布 磁盘 。 一 种 方案 是 在 文件 
系统 中 创建 被 称 为 柱 面 组 (ecylinder group) 的 微 文件 系统 。 

但 是 这 个 经 典 的 模型 并 未 过 时 。 文 件 仍旧 存储 在 数据 区 的 块 中 ,文件 属性 仍旧 存储 在 i 
-PARP AH i TARRA RAAE K; 目录 仅 是 文件 各 和 ji- 节 点 号 的 列 
表 。 现 在 再 来 回顾 一 下 在 前 面 - - 章 中 所 创建 和 探讨 的 目 六 树 。 在 理解 有 
构 以 后 ,再 看 目录 利文 件 的 结构 就 很 清楚 了 。 


BAR 文件 系统 : 编写 pwd | | 107 * 


一 tt 





4.4 Pi A Hx 


在 了 解 了 一 个 Unix 文件 系统 的 目录 结构 之 后 ,就 能 够 知道 日 录 树 究竟 是 怎么 回 事 ,并 
且 能 够 理解 不 同 的 晶 录 从 令 是 如 何 工 作 的 。 


4.4.1 理解 目录 结构 


用 户 看 到 的 文件 系统 是 目录 和 子 目 录 的 集合 。 每 个 日 录 能 够 包含 文件 和 子 自 录 , 每 个 
于 目录 有 一 个 父 目录 ,这 棵 树 的 结 攀 常用 线条 连接 的 访 块 图 来 表示 。 文 件 在 一 个 日 录 中 是 
什么 意思 ? 专业 术语 “dl 是 c 的 一 个 子 日 采 "又 是 什么 意思 ? 图 上 的 线条 代表 什么 意思 ? 

在 文件 系统 内 部 ,目录 是 一 个 包含 文件 名 与 1- 节点 对 的 列表 的 文件 。 从 用 户 的 角度 看 
到 的 是 个 文件 名 的 列表 ,而 从 Unix 的 钊 度 看 到 的 是 一 个 被 但 名 的 指针 的 列表 ,好 图 4.8 
BUR. 


APAR 系统 角度 


demodir 





Fl 4.8 目录 树 的 两 种 不 同 视图 


如 何 从 用 户 的 角度 转换 到 系统 的 角度 ? 通过 在 图 中 添加 i- 节点 号 ,就 能 够 了 解 日 录 树 
是 如 何 连 接 在 一 起 的 。 使 用 ls -iaR 可 以 列 出 一 棵 树 中 的 所 有 文件 的 ij- 节点 号 。 


$ ls - iaR demodir 


865 , 193 T 277 a 520 c 49] y 
denodir/a- 

277 x 865 F 402 x 

demodir/c; 

520 . B65 M 651 dl 247 d2 


demodir;c/dl: 


b5l .. 520 ix 402 xlink 
demodir/c/d2: 
247 . 520 " 680 xcopy 


S 
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4. 9 是 上 例 的 图 示 


PAO FARE 系统 角 讼 


demodir | 49] |Y | 





图 4.9 文件 名 和 指向 文件 的 指针 


(1) “文件 在 目录 中 ?的 真正 含义 

一 般 都 说 文件 存放 在 某 个 目录 中 ,但 是 现在 已 经 知道 目录 中 存放 的 只 是 文件 在 ji- 节 融 
表 的 人 口 ,而 文件 的 内 容 则 存储 在 数据 区 。 文 件 在 某 个 目录 中 是 什么 意思 ? 例如 ,从 用 户 的 
角度 来 看 ,文件 y 在 目录 demodir 中 ,而 从 系统 角度 来 看 ,看 到 的 则 是 目 姑 中 有 一 个 包含 文件 
名 y 和 1~ 节点 号 为 491 HA, 

类 似 地 , “文件 x FEB Ra 中 ?意味 着 在 目录 a 中 有 一 个 指向 ;- 节 扩 402 的 链接 ,这 个 链 
接 所 人 附加 的 文件 名 为 x。 注 意 , 这 一 点 很 重要 ,在 左 端 较 低 处 标 为 dl 的 目录 包含 一 个 指 问 ;i 
-节点 402 的 链接 ,那个 链接 被 称 为 xlink。 称 为 demodir/a/x 的 链接 和 称 为 demodir/c/dl/ 
xlink 的 链接 指向 同一 个 文件 。 

阐 短 地 说 ,上 自 录 包含 的 是 文件 的 引用 ,每 个 引用 .被 称 为 链接 。 文 件 的 内 容 存 储 在 数据 
块 ,文件 的 属性 被 记录 在 一 个 被 称 为 i- 节点 的 结构 中 ,i~ 节 点 的 编号 和 文件 名 存储 在 目录 
中 。“ 目 录 包 含 子 目 录 " 的 原理 与 此 相同 。 

(2)“ 自 录 包 含 子 目录 ”的 真正 含义 

从 用 户 的 角度 来 看 ,目录 s 是 目录 demodir 的 一 个 子 目 录 , 那 么 在 系统 内 部 究竟 是 如 何 
运作 的 呢 ? 实际 上 demodir 包含 一 个 指向 那个 子 目 录 i- 节 点 的 链接 。 从 系统 角度 来 看 ,最 
上 面 一 个 表 包 含 一 个 指向 1- 节 点 277 HARA a. TA 277 是 左边 那个 县 录 的 1- 
节点 号 呢 ?” 每 个 目录 都 有 一 个 i- 节 点, 内核 在 每 个 目录 都 设置 一 个 指 问 县 录 本 身 的 1- 节 点 
HAD; 这 个 人 口 被 称 为 “.”。 在 左边 的 小 方 框 中 ,点 表示 1- 节点 277 ,因此 左边 的 目录 表示 
i 一 节点 277 。 

如 图 4. 10 所 示 .i 节点 520 的 目录 是 如 何 被 包含 在 demodir 中 的 . 它 在 目录 demodir 中 
的 名 字 被 标识 为 c。 类 似 地 ,i~- 节 点 247 是 另 一 个 目录 ,名 字 为 2?, 它 是 -节点 520 的 一 个 
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qd Ho. 


用 广角 度 
demodlr 





ae DINI 
[402 | xnk | 





图 4.10 BS SEI H RAH 


G) “目录 有 一 个 父 目 录 ” 的 真正 含义 

从 用 户 的 角度 看 目录 d2, 它 的 父 目 录 是 c。 这 里 再 次 用 一 个 指 回 1- 节点 的 简单 链接 实 
Hi.Ho ci- TREA 520. HR d2 包含 一 个 称 为 “.. ”的 入 口 。 这 个 入 口 的 i 节点 号 是 
520。",. ”是 父 目录 的 保留 名 宁 。 园 此 ,i 节点 520 是 计 -节点 247 HATA. 

(4) 填充 空白 的 i- 节点 号 

如 果 理 解 了 前 面 的 章节 , 接 下 来 就 能 够 填充 图 4.10 中 的 空余 的 i- 节点 号 。 如 果 不 知道 
这 些 空白 处 该 填 什 么 ,可 以 查看 一 下 ls 的 输出 内 容 并 复习 一 下 前 面 章节 的 内 容 ， 

(50 多 重 链接 及 链接 数 

在 demodir 目录 树 中 ,i- 节 点 402 有 两 个 链接 。 一 个 是 在 且 录 a 中 , 称 为 x, 另 一 个 在 号 
录 dl 中 , 称 为 xlink。 那 么 哪个 是 原始 文件 ? 哪个 是 指向 它 的 链接 呢 ? 在 Unix 的 目录 结构 
中 ,这 向 个 链接 的 状态 完全 相同 ; 它们 被 称 为 指 同 文件 的 硬 链 接 。 文 件 是 一 个 1 节点 和 一 
些 数据 块 的 结合 ; 链接 是 对 i- 节 点 的 引用 。 可 以 对 一 个 文件 创建 任意 多 的 链接 。 

内 核 记录 了 一 个 文件 的 链接 数 。 就 i- 节 点 402 来 说 ,链接 数 至 少 是 2。 因 为 在 文件 系统 
的 其 他 部 分 或 许 还 存在 着 i 一 节点 402 的 其 他 链接 。 链 接 数 被 记录 在 i- 节点 中 ,同时 是 系统 
调用 stat 返回 值 stat 结构 中 的 一 个 成 员 ，。 

(60 文件 名 

在 Unix 的 文件 系统 中 ,文件 没有 文件 名 ,但 是 链接 具有 和 名字。 文件 仅仅 拥有 i- 节点 导 。 
在 后 面 的 章节 中 ,可 看 到 这 种 方法 的 便利 之 处 。 


44.2 与 目录 树 相关 的 命令 和 系统 调用 


Unix 文件 系统 的 内 部 结构 比较 简单 ,仅仅 是 一 些 相 王 链接 的 数据 结构 。 节 点 被 称 为 i 
节点 ,指针 的 集合 被 称 为 上 月 录 , 呈 子 节点 被 称 为 链接 。 通 过 标准 的 Unix 命令 来 对 这 个 树 状 结 
构 进 行 管理 ,例如 mkdir. rmdir,mv.in 和 rm $. MSE TERE? EI tE 
些 相关 的 系统 调用 呢 ? 
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(1)? mkdir 
命令 mkdir 用 来 创建 新 的 日 录 。 它 接受 命 今 行 上 的 一 个 或 多 个 日 菜 名 ,使 用 mkdir 系统 
再 用 : 






































mkdir 
目标 创建 日 录 m i 
sa  gindude <“sys/stat. h> S GELS 
# include «sys/types, h= 
i ETTE EE int result = mkdir(char x pathname, mode t mode) 
|^ 5 98 Dang pat hnane ”新 目录 名 l D 
DEM mode ARRA | 
返回 入 -1 BAAR OO mI 
$ 成 功 创 建 


mkdir 创建 一 个 新 的 日 录 市 点 并 把 它 链接 至 文件 系统 树 。 即 mkdir 创建 了 这 个 目送 的 | 
一 节点 ; 分 配 了 一 个 磁盘 块 用 以 存储 它 的 内 容 ; LAR PRE IT AEESUSUREELLT EIE BR 
配置 了 它们 的 1 一 节点 导 ; 在 它 的 父 日 录 中 增加 一 个 该 节点 的 链接 。 

(2) rmdir | 

命令 rmdir 用 来 出 除 一 个 目录 。 它 接 爱 命令 行 上 一 个 或 多 个 目录 名 ,使 用 rmqir 系统 
调用 : 


rmdir 
目标 | BIER TAR. HEELS E 
ix i include < unistd. h= 
函数 原型 int result — rmdir Cconst char * path); 
SR path 目录 名 
3E EB fi 21 遇 到 错误 
0 战功 删 降 


rmdir KA PRES BRR. RPA RAMESH, WET ML RRA 
ixkT ARES ARE OC PEE Boe. 同时 在 父 目录 中 删除 这 个 目录 的 链接 ， 
如 果 这 个 上 自 录 本 坪 并 未 局 其 他 的 进程 占用 , 它 的 i- 节 点 和 和 数据 块 将 被 释放 。 

(3) rm 

命令 rm 用 来 从 一 个 目录 文件 中 删除 -个 记录 , 它 接受 俞 令 行 上 一 个 或 客 个 文件 名 ,使 
用 unlink 系统 调用 : 


unlink 
目标 删除 … 个 链接 | 
3b Xd l # include « unistd. h> 
EE 函数 原型 int result = unlink (const char * path); 
参数 path EMSRS 
返回 入 E 1 RUE UR 


0 成 功 删除 
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unlink 用 来 删除 目录 文件 中 的 一 个 记录 ,减少 相应 i- 节 点 的 链接 数 。 如果 该 1- 节点 的 
链接 数 减 为 0, 数 据 块 和 i- 节 点 将 被 释放 。 如 果 该 1- 节 点 有 其 他 的 链接 , 则 数据 块 和 1 一 市 点 
He ANE BS ti]. unlink 不 能 被 用 来 删除 日 录 。 

(4) In 

命令 In 用 来 创建 一 个 文件 的 链接 ,使 用 系统 调用 link: 





link 

FER iz 个 文件 的 新 链接 
LAF ft include < unistd, h> 
ARRE int result = link (const char * orig, const char * new); 
参数 orig 原始 链接 的 名字 

new 新 建 链接 的 名 宇 
返回 值 —138 X5 

0 成 功 创建 


link 生成 一 个 1- 节点 的 链接 。 新 链接 包含 原始 链接 的 i- 节点 号 并 且 上 其 有 特定 的 名 字 。 
如 果 已 经 存在 一 个 和 新 链接 名 相同 的 链接 , 则 link 将 失败 。link 不 能 被 用 来 生成 目录 的 新 链 
E. 

(5) mv | 

命令 mv 用 来 改变 文件 和 日 录 的 名 字 或 位 置 , 是 这 小 节 中 所 讲述 的 最 为 灵活 的 一 个 命 
A., ERSAM F., my 仅仅 使 用 系统 调用 rename; 


rename 


目标 重 命 名 或 删除 一 个 链接 
头 文 忻 4 include < 一 unistd. h= 
UR Be m xU int result = rename (const char « from, const char* to); 
参数 from 原始 链接 的 名 字 
to 新 建 链 接 的 名 字 
返回 值 —i 通 到 错误 
0 成 功 返 回 


rename 用 来 改变 文件 或 目录 的 名 字 或 位 置 。 例 如 ,renamet"y"，"y, old") 用 来 改变 文 
件 的 名 字 ;而 rename("y", "c/d2/y. old") 用 来 改变 文件 的 名 字 和 位 置 。rename 适用 于 文件 
税目 录 , 但 是 在 进行 目录 移动 时 有 些 限制 。 例如 ,不 能 将 一 个 目录 移动 到 它 的 子 自 录 中 去 ， 
考虑 一 下 rename("demodir/c". "demodir/d2/c") S Z P^ ^k "EE ARE. AW link 不 同 ， 
rename 将 删除 第 一 个 参数 所 指定 的 已 存在 的 文件 或 空 目录 ， 

rename 是 如 何 将 一 个 文件 移动 到 另 一 个 目录 的 蛇 ? 文件 实际 上 并 不 存在 于 目录 中 , 目 
录 中 存放 的 仅仅 是 它 的 链接 。 因 此 ,rename 将 链接 从 一 个 目录 移动 到 另 一 个 目录 。 将 目 时 
y 移动 到 c/dZ/y. old 看 起 来 就 像 图 4. 11 Bron. 


A ee TERR 
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在 rename fitt — fij rename (^y ","c/dl/y.old" MAf1.2 Je 





图 4. 11 将 文件 移动 到 新 的 冉 录 - 


首先 ,在 demodir 中 存在 着 一 个 指向 1- 节点 491 的 链接 , 称 为 y。 然 后 ,一 个 称 为 % old 
的 指向 1- 节点 的 链接 出 现在 c/d2 中 ,而 原来 的 链接 消失 了 。 内 核 是 如 何 移动 这 些 链接 的 呢 ? 

在 Linux A Ë , rename 的 基本 逻辑 是 : 

。 复制 链接 至 新 的 名 字 / 位 置 

© 删除 原来 的 链接 

Unix 提供 系统 调用 link 和 unlink 完成 这 两 个 操作 。 因 此 ,rename("x"，"z") 是 这 样 运 
fF AY: 


if ( liak( “x”, "z™) l= -1) 
uni ink( “x"); 


实际 上 ,过 去 没有 rename 这 个 系统 调用 ,因此 命令 mv 使 用 系统 调用 link 和 unlink, 1E 
AK PH HASH rename 解决 了 两 个 问题 。 首先 ,rename 使 得 重 命名 或 重 定 位 一 个 目录 
变 得 更 加 安全 。 过 去 ,一般 的 用 户 不 能 对 目录 进行 link 或 unlink 课 作 ,因此 他 们 滤 有 办 法 重 
命名 一 个 目录 :; 

男 一 个 使 用 rename 的 优点 是 文 持 非 Unix 文件 系统 。 在 Unix 中 , 重 命名 一 个 文件 或 日 
录 是 通过 改变 链接 完成 的 ,但 是 其 他 的 系统 可 能 不 按 这 种 方式 和 工作。 将 通用 方法 rename 次 
加 至 内 核 隐 藏 了 实现 的 细节 ,使 得 相同 的 代码 能 够 在 各 种 文件 系统 上 运行 。 

(6) cd 

cd 用 来 改变 进程 的 当前 目录 。cd 对 进程 产生 影响 ,但 是 并 不 影响 有 目录。 一 个 用 户 可 能 
会 说:“ 我 进 人 了 /tmp 目录 ,发 现 一 大 堆 的 垃圾 文件 ", 而 男 一 个 用 户 可 能 会 说 :“ 我 进 人 了 阁 
RAR SIRS IRB”. cd 使 用 系统 调用 chdir: 
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chdir 
目标 改变 所 调用 进程 的 当前 目录 
X4 # include «unistd, h> —— 
p 函数 原型 int result x: chdir (const char * path): E 
参数 path ”要 到达 的 目录 
返回 值 —1 18 e SF x 
0 成 功 改变 . 
Unix 上 的 每 个 运行 程序 都 有 一 个 当前 目录 ,chdir 系统 调用 改变 进程 的 当前 目录 。 在 系 
统 内 部 ,进程 有 一 个 存放 当前 目录 i- 站 点 号 的 变量 。 从 一 个 目录 进入 另 一 个 目录 只 是 改变 


那个 变量 的 值 。 

了 解 cd.. 如 何 工 作 。 使 用 demodir 这 个 例子 ,假设 现在 位 于 一 个 称 为 的 目录 ,那么 . 当 
前 目录 的 i- 节 点 号 是 密 少 ? 如 现在 输入 cd dl, 则 当前 目录 的 i- 节 点 号 是 多 少 ? 内 核 是 如 何 
获得 这 个 值 的 呢 ? 如果 随 后 输入 cd .. /7..,; 则 当前 目录 的 -节点 号 又 是 多 少 ? 内 核 使 用 了 
什么 步骤 获得 该 1- 节点 号 ? 

如 果 知 道 如 何 完 成 这 个 重要 的 练习 ,那么 已 经 明日 命令 pwd EM LET. 


4.5 #1 5 pwd 


命令 pwd 用 来 显示 到 达 当 前 目录 的 路 径 、 例 如 ,如 果 位 于 demodir/c/d2 HAMA 


$ pwd 
fhome/ yourname/experiments/demodir/oc/d2 


这 人 么 长 的 路 径 存 改 在 哪里 呢 ? 其 实 它 并 不 位 于 当前 的 目录 中 。 当 前 目录 称呼 本 身 为 
“ ”并且 有 一 个 i- 布点 号 。 目 录 仅 是 相互 连接 的 节点 集合 中 的 一 个 节点 。pwd 如 和 何 知道 该 
H sede c2,c2 ASC BORA coc 的 父 日 录 是 demodir W? | 


4.5.1 pwd 的 工作 过 程 


就 像 本 章 中 所 有 问题 的 答案 一 样 ,这 个 问题 的 答案 也 是 简单 的 : 追踪 链接 , 读 取 日 录 , 一 
个 目录 接着 一 个 日 录 地 沿 着 树 向 上 追踪 ,每 步 查 看 “. ”的 1- 节 点 号 ,然后 在 父 目 录 中 查找 该 i 
-HARAT ARENA H AIE ii WE 4. 12 所 示 。 

MARA RO REA FART AR HREM. ERA RYE. EH ERA 
"LU ,拥有 i 一 节 点 号 247。 现 在 利用 chdir 向 上 到 达 父 目录 ,查找 含有 1- 节点 247 的 人 口 。 在 
父 目 录 中 ,节点 247 称 为 d2。 因 此 ;路径 的 最 后 一 项 是 d2。 父 目录 的 名 字 是 什么 呢 ? 在 父 
ASPENS SE.” PP i- FAS 520。 通 过 chdir 进 人 它 的 父 目 录 , 可 以 看 到 ji- 节点 
520 名 字 为 <。 因 此, 路径 的 最 后 两 项 是 c/d2。 算 法 是 以 下 3 个 步骤 的 重复 。 
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6 1, “2° SE 247 
EE 3 chair, . 
ASY — | 2. 247 t g^ d2" 
chatr.. 
1520]. ]3 : 520 RA” 
zg E "E 865 
402 [xX | SEL 3 pn 
B. 865 wd 
nk | "eir. 


图 4.12 计算 当前 路 径 


(1) 48 mj". "B5 i1- Pas LER EL nt 使 用 stat), 

(2) chdir, . (使 用 chdir). 

(32 RA -PEE n 链接 的 名 字 ( 合 用 opendir.readdir,closedir? , 

重复 (直到 到 达 树 的 顶端 ) 。 

这 看 起 来 很 简单 ,但 是 也 有 两 个 问题 。 

问题 1 ;如何 知 道 已 经 到 达 了 树 的 顶 闪 ? 在 一 个 Unix 文件 系统 的 根 目录 中 ,，“." 和 "..” 
指向 同一 个 i- 节 点。 编程 者 通常 将 下 一 个 指针 置 为 NULL, 用 来 标识 .个 链表 结构 的 结束 ， 
Unix 的 设计 者 本 可 以 将 根 目 录 的 “.,” 置 为 空 , 但 是 还 是 决定 将 它 指向 本 身 。 考 虚 一 下 这 个 
设计 的 优点 是 什么 ? 回 到 刚才 的 问题 ,基于 以 上 原因 ，pwd 命令 重复 循环 直到 一 个 目录 的 
“RIS. . ”的 1 节点 号 相同 时 ,就 可 以 认为 已 经 到 达 文 件 树 的 顶端 。 

问题 2: 好 何以 正确 的 顺序 显示 月 录 和 名 字 ? 可 以 建立 一 个 循环 ,使 用 streat 或 sprinti 建 
立 目 录 和 名 字 的 字符 串 序 列 。 通 过 一 个 递归 的 程序 逐步 到 达 畦 的 顶端 来 一 个 接 一 个 地 显示 目 
录 名 ,从 而 避免 了 字符 串 的 管理 ， 


4.5.2 pwd 的 一 种 版 本 


/* spwd.c; a simplified version of pwd 
x 

* starts in current directory and recursively 
* climbs up to root of filesystem, prints top part 
* then prints current part 
* 

* uses readdir() to get info about each thing 
* 
* bug; prints an empty string if run from "/" 
* x/ 

H include | «stdio. h> 

H include — «sys/types.h-— 

H include «< sys/ stat. h> 
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i include <(dirent. h> 


ino t get inode(char * }; 
void printpathto(ino t); 


void inum to name(ino t , char * , int ); 

int maint) 

i 
printpathto( get inode( "." } 5; /* print path to here x/ 
putchar( '\n'); /* then add newline «/ 


return QU: 


void printpathto( ino t this inode ) 
fx 
* prints path leading down to an object with this inode 
* kindof recursive 
x / 
i 
ino t my inode ; 
char its name| BUFSIZ |; 
if ( get. inode(",, ") I= this inode } 


| 


chdir( ".." 5; /* up one dir «/ 
inum to name(this inode, its. name,BUFSI2); /* get its name */ 
my inode = get inode( "."); /* print head x/ 
printpathto( my inaode ); /* recursively «/ 


printf("/ &s", its name >; /* now print */ 


f 


/* name of this */ 


j 
void inum to name(ino t inode to find , char x namebuf, int buflen) 
i* 
* looks through current directory for a file with this inode 
* number and copies its name into namebuf 
*/ 
| 
DIR * dir ptr; /* the directory x/ 
struct dirent + direntp; ^. f* each entry x/ 
dir ptr = opendir( "."): | 
if ( dir ptr == NULL ){ 
perror( "." Jj. 
exit(l); 
| 
£X 
* search directory for a file with specified inum 
x/ 
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while ( ( direntp = readdir( dir ptr ) } } = NULL) 
if ( direntp-7»d ino == inode to find) 
i 
strncpy( namebuf, direntp —-d name, buflen); 
namebuf[buflen - 1] = MD'; /x just in case */ 
closedir( dir ptr): 
return; 
i 
fprintf(stderr, "error looking for inum * d\n", inode to find); 
exit(1); 
| 
ino t get inode( char * fname ) 
f* 
* returns inode number of the file 
xf 
| 
5truct stat info; 
if ( stat( fname , &info ) == -1)4 
fprintf(stderr, "Cannot stat "); 
perror( fname) ; 
exit(l); 
} 


return info. st ino; 


下 面 是 命令 pwd 与 spwd 执行 后 的 比较 : 


$ /bin/pwd 
/home/bruce/experiments/demodir/c/d2 
S sped 

/ bruce/experiments/demodir/c/d2 

S 


命令 pwd 将 显示 到 达 树 根 的 路 径 ,而 这 个 版 本 在 到 达 树 根 之 前 就 停止 了 。 问 题 在 哪儿 呢 ? 是 
不 是 因为 编码 不 当心 导致 的 问题 ? 不 是 ,程序 实际 上 是 完全 按照 原来 的 设想 工作 的 , 它 在 到 达 文 
件 系统 的 根 时 停止 ,只 是 这 个 文件 系统 的 根 并 不 是 这 个 计算 机 上 整 棵 文件 树 的 根 。 

Unix 允许 将 一 个 磁 礁 的 存储 组 织 成 一 标 由 多 标 树 相互 连接 的 树 。 每 个 磁盘 或 惑 盘 上 的 
每 个 分 区 都 包含 一 棵 目录 树 。 这 些 独立 的 树 被 连接 成 一 标 单 一 的 几乎 无 名 的 树 。 这 个 版 本 
的 pwd 恰好 磁 上 了 树 之 间 的 连接 地 带 。 


4.6 多 个 文件 系统 的 组 合 : HL RRR CRU 


一 个 Unix 系统 有 两 个 磁盘 或 分 区 将 会 如 何 ? 现 在 已 经 知道 ,用 一 些 简 单 的 抽象 能 够 将 
一 个 单一 的 分 区 组 织 成 一 棵 目录 树 。 俱 是 如 果 有 两 个 分 区 ,需要 两 棵 独立 的 树 吗 ? 


© |]7 - 


gy 4X X ft 3 Í&. fà E pwd 





——— 


其 他 的 系统 又 是 如 何 做 的 呢 y CR Je PETER BUFFETT om Or Bo 18 p OX X 323 IX (OT 
将 字母 或 名 字 作 为 一 个 文体 人 金 路 径 的 一 部 分 。 男 一 种 做 法 是 ,有 些 系 统统 一 给 所 有 的 磁盘 


分 配 世 的 编号 以 创建 一 个 虚拟 的 单一 夏 航 ， 
Unix f& H55 — MAM. 每 个 分 反 有 自己 的 文件 系统 树 。 当 计算 机 上 有 多 于 一 个 的 文件 


系统 时 ，Unix 提供 一 种 方法 将 这 些 树 整合 成 一 棵 更 大 的 树 。 图 4. 13 表示 了 这 个 方法 。 
用 户 角度 :一 棵 村 O BRAR: KAR 





图 4. 13 树 的 嫁接 


岛 4.13 中 用 户 看 到 的 是 一 棵 完好 的 目录 诗 , 但 是 实际 上 有 两 棵 树 ,一 个 在 磁盘 ] 上 ,一 
TERR 2 上。 每 慰 树 都 有 一 个 根 自 录 。 一 个 文件 系统 被 命名 为 根 文件 系统 ,这 棵 树 的 顶端 
EM PW VAI AR: 另 一 个 文件 系统 则 被 附加 到 根 文件 系统 的 某 个 子 目 录 上 。 在 内 部 ,内 
核 在 恨 文 件 系统 将 一 个 目录 作为 指针 ,指向 另 一 个 文件 系统 的 根 , 这 样 两 个 文件 系统 就 联系 


EXT., 
4.6.1 装载 点 

在 Unix 中 ,装载 文件 系统 (to mount a file system) BERBERA AE AM KSEE 
某 些 文 持 FR ARMA BRAM TAH. TEM RES 


系统 的 装载 点 (mount point), 
命令 mount 列 出 当前 所 装载 的 文件 系统 以 及 它们 的 装载 点 ， 


5 mount 

/dev/hdal on / type exc2 (rw) 

/dev hda6 on /home type ext2 (rw) 

none on /proc type proc (rw) 

ncne on 'dev/pts type devpts (rw, mode = 0620) 


Ss 

输出 的 第 一 行 表 明 /dev/hda 上 的 分 区 1( 第 一 个 IDE 设备 ) 被 装载 在 树 的 根 目录 上 。 这 
个 分 区 是 根 文 件 系统 。 和 输出 的 第 二 行 表明 dev/hda6 上 的 文件 系统 被 装载 在 根 文 件 系统 的 / 
home 目录 上 。 内 此 , 当 用 户 使 用 chdir JA */" 进入 “/home" 时 ,实际 上 是 从 一 个 文件 系统 进 
人 十 刃 一 个 文件 系统 。 当 该 pwd 沿 树 向 上 回溯 时 , 它 就 会 停 在 /home， 因为 它 到 达 了 该 文件 
系统 的 顶端 。 
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i eee ee ee es ee ee i al ks eee we ee m he mi 


Unix 允许 不 同类 型 的 文件 系统 被 装载 在 要 文件 系统 .例如 ,一 个 含有 ISO 9660 KER 
统 的 CD-ROM 能 够 被 装载 在 一 个 Unix 机 器 上 ,并 且 盘 上 的 目录 和 文件 将 会 成 为 树 的 一 部 
分 。 如 果 央 核 包 含 知道 如 何 与 Macintosh 文件 系统 协同 上 作 的 驱动 程序 ,那么 一 个 售 有 
Macintosh 文件 系统 的 磁盘 就 能 够 被 装载 。 其 至 ,通过 网 络 连 接 的 其 他 的 计算 机 上 的 文件 系 
统 也 能 够 被 装载 。 


4.6.2 和 多重 i- 节 点 号 和 设备 交叉 链接 


将 不 同 的 文件 系统 合成 一 棵 树 有 很 多 优点 ,当然 也 有 小 问题 。 在 Unix 中 ,每 个 文件 都 
有 一 个 i- 节点 号 。 就 像 两 条 不 同 的 街道 都 有 一 个 门牌 号 为 402 的 房子 一 样 , 两 个 不 同 的 科 
盘 可 能 都 含有 i- 节 点 号 为 402 的 文件 。 车 干 个 目录 可 能 都 含有 i- 节点 导 为 402 的 文件 ,内 
核 是 如 何 知 道 应 该 使 用 哪个 402 89 1 ex WR 

仔细 观察 图 4. 14 中 被 圈 出 来 的 两 个 目录 ,一 个 在 根 文 件 系统 ,一 个 在 被 装载 的 文件 系 
统 。 每 个 目录 都 包 会 一 个 i- 节 点 402 的 链接 。myls.c 和 y. old 似乎 为 指向 同 - -个 i 节 点 的 
两 个 链接 ,但 是 邦 个 1- 节点 在 哪 呢 ? 磁盘 1 上 的 文件 系统 有 一 个 i- 节操 402, Ree 2 上 的 文 
件 系统 有 一 个 不 同 的 1 节点 402。 这 两 个 链接 根本 不 指 问 同一 个 文件 。 





lH 4,14. i- 节 点 号 和 文件 系统 


这 个 例子 列举 了 一 个 由 树 连 接 成 树 的 一 个 间 题 , 即 一 个 i- 节点 号 并 不 惟一 地 标识 一 个 
文件 了 。 就 像 刚 刚 看 到 的 那样 ,相同 的 1 一 节点 号 402 出 现在 两 个 不 同 的 目录 中 , 却 指向 2 个 
不 同 的 文件 。 看 起 来 这 两 个 链接 指向 同一 个 文件 ,但 实际 上 却 不 是 。 

如 何 从 不 同 的 文件 系统 生成 指向 同 个 文件 的 链接 ? 这 一 点 是 无 法 做 到 的 ,文件 以 数 
据 块 的 集合 和 一 个 i- 节 点 的 形式 出 现在 磁盘 上 ,月 录 中 的 链接 会 指向 那个 1- 节点。 如 果 一 
个 磁盘 上 的 链接 指向 另 一 个 磁盘 上 的 i- 节 点 将 会 发 生 什 么 事 ” 如 果 另 一 个 磁盘 未 被 装载 ， 
文件 则 会 不 存在 。 更 糟糕 的 是 ,如 果 一 个 存 赃 着 拥有 i 一 节点 402 BU [n] X PERI [e] i c t 
装载 , 则 文件 的 内 容 就 完全 不 同 了 。 你 也 可 以 想到 其 他 麻烦 的 情况 。 

link 和 rename 系统 调用 知道 这 种 情况 吗 ? 知道 。link 拒绝 创建 跨越 设备 的 链接 ， 
rename 拒绝 在 不 同 的 文件 系统 癌 进行 1- 节点 号 的 转移 。 阁 读 手 册 可 以 了 解 它们 气 返 回 的 
T IC. 
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4.6.3 符号 链接 


硬 链接 (hard tinks) 是 将 目录 链接 到 树 的 指针 ，, 硬 链接 同时 也 是 将 文件 名 和 文件 本 号 链 
接 起 来 的 指针 。 

人 硬 链接 不 能 指向 其 他 系统 中 的 i- 节点 ,即使 根 也 不 能 生 碟 到 目录 的 链接 。 也 许 有 冯 持 
这 种 跨 系 统 链接 的 理由 ;但 Unix 点 持 另 一 种 形式 的 链接 : 符号 链接 。 符 号 链接 通过 名 字 引 
用 文件 ,而 不 是 i- 节点 号 。 以 下 是 它们 的 比较 : 


$ who > whoson 

S in whoson ulist 

5 ls — li whoson ulist 

377 .-rw-r--r-- 2 bruce users 235 Jul 16 09:42 ulist 
377  -rw-r--r-- 2 bruce users 235 Jul 16 09.42 whoson 
$ ln - s whoson users 


S ls - li whoson ulist users 


377  -rw-r-r-- 2 bruce users 235 Jul 16 09.42 ulist 
289 lrwxrwxrwx 1 bruce users 6 Jul 16 09.43 users -> whoson 
377 rw-r_r 2 bruce users 235 Jul 16 309.43  Whoson 


文件 whoson A ulist 是 指向 同 个 文件 的 链接 。 两 个 都 拥有 i- 节点 号 377, 都 有 同样 的 
文件 大 小 .修改 时 间 和 链接 数 。 通 过 命令 In 创建 硬 链 接 ulist， 

另 一 方面 ,命令 In -s 生成 文件 whoson 的 一 个 符号 链接 ,并 把 这 个 新 链接 称 为 users, 
ls -1 显示 users 拥有 i- 节点 289。 字 母 1 在 文件 类 型 点 处 开明 users 是 一 个 符号 链接 。 链 
接 数 .修改 时 间 和 文件 大 小 都 不 同 于 原始 文件 。 文 件 users 并 不 是 原始 文件 whoson, 但 是 当 
程序 对 它 进 行 读 号 时 , 它 就 像 原 始 文件 一 样 。 例 如 : 


òà wc - 1 whoson users 
5 whoson 
2 uSers 
10 total 


§ diff whoson users 


$ 


命令 we 和 ditt 分别 用 于 对 文件 计算 行 数 和 比较 内 容 。 在 这 种 情况 下 ,内 核 使 用 名 字 找 
到 原始 文件 。 另 一 方面 ,对 函数 stat 的 调用 返回 关于 链接 的 信息 , 而 不 是 关于 原始 文件 2 的 ， 

符号 链接 可 能 跨越 文件 系统 ,因为 它们 并 不 存 情 原始 文件 的 1i- 节 点 。 符 号 链接 也 可 以 
指向 目录 ,因为 它们 与 将 文件 系统 联系 在 一 起 的 真正 的 链接 不 同 ， 

在 交叉 设备 链接 的 情况 中 符号 链接 也 存在 前 面 所 讨论 的 问题 ,如 果 保 存 原 始 文件 的 文 
件 系 统 被 删除 了 ,或 者 原始 文件 有 了 新 的 文件 名 ,符号 链接 都 将 指向 空 。 如 果 一 个 拥有 相同 


一 一 一 


Do XB RI Istat 返回 链接 所 指 划 的 文件 的 信息 ， 
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名 字 的 文件 被 加 载 了 .符号 链接 则 将 指向 不 同 的 文件 ,指向 目录 的 符号 链接 可 以 指 回 父 目 


录 ,因此 在 日 录 树 中 产生 循环 套 。 符 号 链接 可 以 将 你 的 文件 系统 彻 慌 搞 乱 ,但 是 内 核 知 道 这 
些 仅 是 符号 链接 .而 不 是 直 正 的 链接 ,所 以 能 够 恰 查 丢失 的 引用 和 死人 入 环 . 

系统 调用 symlink 用 于 创建 一 个 符号 链接 。 系 统 油 用 readlink 用 于 获取 原始 文件 的 名 
=, Istat 用 于 获取 原始 文件 的 信息 。 D ER UL TE BJ) BÍ EA f£ f unlink, hnk 和 符号 链接 是 如 
何 作用 的 。 


B 


小 结 


主要 内 容 


+ Unix 将 存储 在 磁盘 中 的 狼 据 组 织 成 文件 系统 。 文 件 系 统 是 文件 和 目录 的 集合 。 日 


录 是 名 字 和 指针 的 列表 。 有 目录 中 的 地 -个 人 口 指向 一 个 文件 或 月 录 。 目 录 包 含 指 向 
父 吓 录 积 子 目 录 的 人 口 。 


* Unix 文件 系统 包含 3 个 主要 部 分 : 超级 块 , -节点 麦 和 数据 区 域 。 文 件 内 容 存 储 在 


数据 块 。 文 件 属 性 存储 在 i 一 节点 。 表 中 -节点 的 位 置 称 为 文件 的 | 一 节点 导 。1i~ 节 
点 号 是 文件 的 惟一 林 识 。 


， 相同 的 1 节点 号 可 能 以 不 同 的 名 字 在 若干 个 目录 中 出 现 。 每 个 人 口 被 称 为 指 问 文 


件 的 硬 链 接 。 符 号 链接 是 通过 文件 名 引用 文件 .而 不 是 1- 节点 号 。 


”若干 个 文件 系统 的 目录 人 鱼 可 被 整合 成 一 棵 树 。 内 核 将 一 个 文件 系统 的 目录 链接 到 另 


di 


一 个 文件 系统 的 根 的 操作 称 为 装载 . | 

Unix & & A TR StU A. VE Pr i E IT BY BE A E B o LA t t EE .删除 指针 、 
改变 连接 和 分 离 其 他 文件 系统 等 的 操作 . 

图 示 


日 录入 口 是 文 件 名 和 i- 节点 号 组 成 的 对 。1- 节 点 号 指向 磁盘 上 的 一 个 结构 ,该 结构 包 
含 文件 信息 和 数据 块 的 分 配 . 如 图 4. 15 所 示 。 





图 4 15 i- P sa GER Doe. dg 
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3， 下 一 章 的 内 容 

文件 只 是 一 种 类 型 的 数据 源 。 程 序 也 可 处 理 来 自 于 像 终 端 ,数码 相机 .扫描 仪 等 设 符 的 
数据 。Unix 程序 如 何 从 设备 读 取 数据 和 发 送 数 据 呢 ? 

4. 习题 


4. i 


4. 2 


4. 4 


4,6 


pwd Ba RFRA PAA AWARE. MERLE BTA REE mn 
所 处 的 位 置 。 实 际 上 该 目录 是 一 些 字 节 的 集合 ,而 这 个 集合 仔 情 在 磁盘 上 的 某 个 
位 置 ,该 位 置 能 以 柱 面 .磁头 、 户 区 和 字 节 的 方式 定位 。 有 办 法 将 当前 工作 上 且 录 转 
换 成 这 些 硬件 位 置 吗 ? 


看 `- 下 所 使 用 的 系统 中 的 一 个 栈 盘 。 找 出 它 有 多 少 个 分 区 ,确定 每 个 分 区 的 放 节 
点 的 个 数 和 数据 抉 的 个 数 。 


Unix 不 仅仅 是 在 内 部 使 用 将 磁盘 抽象 成 序列 的 方法 创建 文件 系统 ,而 且 写 使 得 这 
个 抽象 方法 适用 于 任何 拥有 合法 权限 的 用 户 。 要 做 这 个 实验 ,需要 有 最 高 权限 ， 
HE HERR. 

/dev EREA fn VEU EAHA p ERE 9 d E EE A E E BE E H RT X 
可 以 认为 数据 就 在 这 些 文件 中 。 在 一 个 装 有 IDE 设备 的 Linux 系统 上 ,可 以 看 到 
Wi fit /dev/hda, /dev/hdb,dev/hdc./dev/hdd 的 文件 .这些 设 备 文件 不 是 像 Aetcy 
passwd 或 /var/adm/utmp 这 样 的 常规 数据 文件 。 这 些 数据 文件 提供 对 磁盘 上 原 
始 数据 的 访问 ,而且 可 以 使 用 cat, more,cp 和 其 他 的 命令 来 读 取 和 磁 委 上 的 内 容 ， 
就 像 文 件 ump 一 样 ,磁盘 有 一 个 清晰 的 结构 。 一 块 楼 一 抉 地 查看 磁盘 内 容 的 一 
种 方法 是 使 用 命令 od -c/dev/hda | more。 当 查看 该 命令 的 输出 时 ,就 会 觉得 磁 
盘 是 一 个 顺序 的 .连续 的 磁盘 所 一 样 。 每 个 分 区 都 由 其 中 的 一 个 特定 文件 表示 。 


fis. dev/hda 上 的 第 一 个 分 区 被 称 为 /dev/ihdal， 


查看 系统 中 的 /der E x ELSE ECT XR Be E98 S SR 35 SX ra 36, CD-ROM 驱动 
1 Rz fitt i d RECIBE X PF. 


A Str RU LC CE B — Te BRA P SS BS i- SCRI BUR BEER. UN 
核 如 何 知 道 哪些 磁 是 块 是 空 的 ? 哪些 i 一 斑点 是 空 的 ? 你 机 器 上 的 文件 系统 使 用 
什么 方法 跟 足 那些 未 被 使 用 的 磁盘 块 和 i- 节 点 呢 ? 


Unix EB ERARA ESIE Unix 文件 系统 的 磁盘 , 像 PC-DOS 和 Macintosh f 
B. TAR PERMA I Ta, BAGUE. TS AHS mount 将 其 中 一 个 厂 
IED) Unix 系统 时 ,命令 ls -1 将 会 列 出 i 一 节点 。 

查看 Linux 源 代 码 以 确定 这 些 编号 从 何 处 来 。Linux 为 何 添加 它们 ? 


本 章 中 通过 描述 包含 10 个 直接 块 、1 TARR 个 二 级 间接 块 和 1 个 三 级 间接 块 

的 i- 节 点 解释 了 分 配 列表 。 有 些 Unix 版 本 使 用 不 同 的 编号 。 

CL) 你 所 使 用 的 系统 上 的 i 一 节点 分 配 列表 的 格式 是 怎样 的 ? 头 文件 应 该 包含 这 
些 详细 内 容 。 
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(2) 你 系统 上 的 一 个 数据 块 的 太 小 是 多少 ? 

(3) 在 你 的 系统 上 ,不 使 用 间接 块 的 最 大 文件 是 什么 ? 

GD 在 你 的 系统 上 ,不 使 用 二 级 间接 块 的 最 大 文件 是 什么 ? 最 大 的 文件 实际 上 用 
Sehr rR? 


一 个 文件 可 能 有 多 个 链接 。 链 接 计 数 器 记录 了 文件 的 链接 个 数 。 那 么 目录 如 何 
We? 在 你 自己 的 demodir HH [eH Is -1 找 出 每 个 目录 的 链接 数 。 将 这 些 链 接 数 
和 图 表 上 的 篇 头 相 比较 。 解 释 日 录 人 链接 数 的 意思 。 为 什么 每 个 自 录 的 链接 数 至 
少 为 2? | 


没有 人 人 能够 使 用 link 生成 到 目录 的 新 链接 。 在 过 去 ,超级 用 户 有 权 生 成 到 目录 的 
硬 链接 ， 在 demodir 的 例子 中 , 疯 测 在 用 户 视 岁 和 系统 视图 中 添加 系统 调用 link 
C"rdemodir/c"，"demodir/d2//e 中 执行 后 所 产生 的 效果 。 然 后 解释 命令 ls -iaR 
demodir 将 产生 什么 结果 ， 


当 使 用 mount 命令 将 一 个 文件 系统 装载 到 另 一 个 文件 系统 ,装载 点 必须 是 原 有 文 
件 系 统 的 一 个 目录 。 考 虑 将 /dev/hdad 上 的 文件 系统 连接 到 /home2 这 个 目录 上 
的 情况 ,思考 以 下 两 个 问题 ， (1) 如 果 /home2 这 个 装载 点 不 存在 将 产生 什么 结果 ” 
C2) 如 果 装 载 点 存在 ,有 目 包 含 交 件 和 子 目 录 , 将 产生 什么 结果 ? 


命令 rmdir 不 删除 含有 文件 或 子 目 录 的 目录 。 为 什么 要 这 人 么 做 ? 

另 一 方面 ,可 以 融 除 含有 用 户 的 目录 SRO PRE: 生成 一 个 由 自己 命名 的 
新 目录 并 进入 这 个 目录 ,然后 开启 另 一 个 俞 令 窗 口 , 删 除 这 个 新 目录 。 关 闭 第 二 
个 命令 窗口 ,输入 命令 /bin/pwd, 看 看 将 产生 什么 ，。 


硬盘 上 的 柱 面 (cylinder) 是 什么 意思 ? 硬盘 的 物理 构造 是 什么 使 得 柱 面 这 个 概念 
对 有 效 利用 磁盘 如 此 重要 ? 在 网 上 查找 柱 面 组 (eylinder group) 这 个 概念 。 解 释 
这 个 概念 和 本 章 中 文件 系统 模型 之 间 的 联系 ， 


很 多 人 都 了 解 磁盘 空 何 不 足 这 个 概念 。 一 个 Unix 文件 系统 有 一 个 1- 节 点 区 域 
和 一 个 数据 区 域 。 因 此 ,即使 数据 区 有 空间 ,i- 节 点 空间 也 有 可 能 不 足 。 当 在 
Unix 上 安装 了 一 个 新 的 磁盘 ,需要 将 磁 失 分 成 1 一 节点 表 和 数据 区 。 文 件 系统 上 
的 每 个 文件 都 需要 一 个 i- 节 点 。i- 市 点 表 越 大 , 留 给 文件 内 容 的 空间 越 小 。 
假设 要 安装 一 个 新 的 硬盘 。 命 令 mkfs 生成 一 个 新 的 文件 系统 并 且 让 你 确定 i- 
TAREA. 阅读 联机 帮助 以 了 解 这 个 命令 。 为 什么 需要 大 量 的 i- 节点? 为 
什么 有 时 人 息 又 比 常 规 需 要 的 少 ?” 


系统 调用 stat 接受 文件 名 和 和 指向 结构 的 指针 ,并 且 将 文件 信息 填充 到 该 结构 中 ， 
解释 stat 是 如 何 通 过 使 用 目录 、i -节点 各 数据 模型 米 完 战 该 功能 的 、 它 是 从 哪 
里 找到 数据 并 将 数据 复制 到 stat 结构 中 的 呢 ? 
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4, 14 
4, 15 


4. I6 


4, 20 


6. A 
基于 本 


编写 一 个 创建 整个 demodir 日 录 树 的 Unix 命令 ， 
Unix 命令 mkdir 接受 选项 -p。 编 写 一 种 支持 这 个 选项 的 mkdir 命令 版 本 。 


命令 mv 不 仅仅 调用 系统 调用 rename, A5 … 种 接受 两 个 参数 的 mv RA, $ 
一 个 参数 必须 是 文件 名 ,第 二 个 参数 是 文件 名 或 目录 名。 如 果 目 标 是 个 目录 各， 
则 mv eR AIA PAR. GW. RA ERG. my 将 重 命名 这 个 文件 。 


本 章 中 提供 了 一 种 使 用 link 和 unlink 编写 的 rename 版 本 。 该 代码 片断 检验 
link 的 返回 值 , 但 是 并 未 检验 unlink 的 返回 值 。 扩 充 该 段 代 码 , 使 得 它 能 够 正确 
处 理 unlink Aafia A. 


阅读 联机 帮助 和 涉 交 件 以 了 解 系 统 上 的 超级 块 的 结构 。 编 写 一 个 能 够 打开 文件 
系统 ,阅读 超级 块 和 以 清晰 可 读 的 格式 显示 文件 系统 设置 的 程序 。 这 个 练习 与 
显示 utmp 记录 内 容 和 stat 结构 的 程序 类 似 。 


对 新 建 一 个 文件 的 解释 列 出 了 4 个 主要 的 操作 。4 个 操作 必须 完全 正确 才能 使 
文件 能 够 被 正确 添加 到 文件 系统 。 如 果 计 算 机 在 这 一 系列 的 操作 中 突然 掉 电 将 
会 发 生 什 么 情况 ?例如 ,如 果 数 据 被 存储 在 了 数据 区 ,而 -市 点 还 未 被 分 配 ,将 
REAR? 

COD 为 这 4 个 操作 选择 一 种 顺序 ,并 加 以 解释 。 

(2) 现在 狼 设 一 个 系统 按照 (1) 的 答案 被 创建 ,如 条 系统 在 这 个 过 程 中 突然 前 省 
将 怎么 办 ? 例如 ,你 的 过 程 有 4 个 步骤 .3 个 中 间 点 ,在 每 个 点 的 和 月 省 将 会 导 
致 文件 系统 的 哪些 不 一致 性 呢 ? 

(3) 阅读 Unix 命令 fsck。 看 看 (2) 的 管 案 和 fsck 寻找 的 内 容 有 多少 蚌 接近 的 。 


在 第 3 章 中 编写 了 ls -1 的 一 个 版 本 。 修 改 那个 程序 ,使 得 它 不 仅 能 够 显示 原先 
的 信息 ,还 能 显示 i- 节 点 号 。 另 外 ,你 的 新 版 本 的 Is 是 从 哪里 找到 1- 节点 号 的 ? 


章 的 内 容 , 你 能 够 了 解 和 编 与 以 下 这 些 Unix 程序 ， 


find,du,ls —R,mount,dump 





概念 与 技巧 

， 文件 和 设备 间 的 相似 之 处 
， 文 件 和 设备 间 的 不 同 之 处 
* 连接 的 属性 

。 竞争 和 原子 操作 

， PE til Be fe WK oh EIF 

> di 

相关 的 系统 调用 

+ fentl ioctl 

* fesetattr,tcgetattr 

相关 命令 

* stty 


* write 


5.1 为 设备 编程 


前 面 章节 中 已 经 讲述 了 -一 些 与 文件 和 目录 相关 的 程序 。 计 算 机 还 有 其 他 的 数据 来 源 ， 
如 调制 解 调 器 、 打 印 机 、 扫 描 仪 . 亿 标 ,扬声器 、 照 相机 和 终端 等 这 样 的 外 部 设备 。 在 本 章 中 
将 学 习 这 些 设备 与 办 水 和 和 文件 的 相似 之 处 和 不 同 之 处 ,并 了 解 如 何 将 这 些 想 法 用 于 管理 设 
fr iB) HO XE E. | 

本 章 的 项 员 是 编写 命令 stty 的 另外 一 个 版 本 。stty ARIE Pr 380 E pce h E Ae A 
显示 融 连 接 属 性 的 设置 。 


5.2 设 符 就 像 文件 


很 多 人 认为 文件 是 一- 些 存储 在 磁盘 上 的 数据 ,但 是 Unix 采用 一 种 更 抽象 的 方法 。 首先 
考虑 文件 的 实际 情形 ; 文件 包含 数据 ,具有 属性 ,通过 有 目录 中 的 名 字 补 标识。 可 以 从 一 个 文 
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件 读 取 数 据 , 也 可 以 向 一 个 文件 写 人 数据 。 现 在 请 注意 ,这 种 方法 将 被 应 用 于 设备 。 

考虑 一 块 连接 到 才 上 克 风 和 扬声器 的 声卡 。 你 对 着 麦克 风 说 话 , 声 卡 将 来 自 你 声音 的 信 
号 转换 成 数据 流 , 使 得 程序 能 够 读 取 这 个 数据 流 。 当 程序 向 声卡 瑟 人 数据 流 时 ,声音 就 从 扬 
声 器 中 出 来 。 对 一 个 程序 来 说 ,声卡 既是 数据 的 源 , 又 是 数据 的 和 且 的 地 .。 

一 个 带 有 键盘 和 显示 器 的 终端 也 和 文件 类 似 。 键 盘 输 人 就 像 数据 一 样 能 够 被 程序 恋 
X , 而 一 个 进程 把 写 人 终端 的 字符 显 尔 在 屏幕 上 。 

对 Unix 来 说 ,上 声卡 、. 终 内 、 思 标 和 磁盘 文件 是 问 一 种 对 象 。 在 Unix 系统 中 ,每 个 设备 都 
被 当做 一 个 文件 。 等 个 设备 都 有 -- 个 文件 名 .一 个 1 一 节点 号 .一 个 文件 所 有 者 .一 个 权限 位 
的 集合 和 最 近 修 改 时 间 。 怀 所 了 解 的 和 文件 有 关 的 所 有 内 容 都 将 被 运用 于 终端 和 其 他 的 
设备 。 
5.2.1 设备 具有 文件 名 


每 个 加 载 到 Unix 机 器 的 设备 (终端 ,打印 机 .鼠标 ,磁盘 等 ) 都 通过 文件 名 表示 。 通 常 ， 
表示 设备 的 文件 存放 在 目录 /dev 中 ,但 是 可 以 在 任何 目录 中 创建 设备 文件 。 请 查看 不 同 
Unix 机 器 上 的 "dev 目录 。 以 下 是 我 所 使 用 的 机 器 上 的 部 分 列表 : 


Sls - C /dev | head - 5 


XOR fdlu720 loop] ptyqf sda7 stderr ttysd . 
agpqart fdlu800 ipd ptyrü sdaB stdin ttysc 
apm bios  fdlu820 lpl ptyrl sda9 stdout ttysf 
ared fd] 1830 lp2 ptyr2 sdb tape ttytÜ 
dsp flash mod ptyr3 sdbi tcp ttyti 


这 个 列表 普 示 了 夺 干 种 设备 。 第 三 列 中 的 ips 文件 是 打印 机 。 第 二 列 中 的 fd 文件 是 
软驱 。sd * 文件 是 SCSI 设备 的 分 区 ,/dev/itape 是 磁带 备份 驱动 程序 的 设备 文件 。 最 后 一 
列 中 的 ty x 文件 是 终端 。 程序 通 过 读 取 这 些 文件 获得 用 户 的 键盘 输入 ,通过 写 人 这 些 文件 
向 终端 屏幕 发 送 数 据 。 

dsp 文件 是 到 声卡 的 一 个 连接 。 进 程 通 过 向 该 设备 文件 写 人 字 贡 来 运行 一 个 声音 文件 。 
进程 可 以 通过 打开 文件 /dev/mouse 来 读 取 和 恨 标 的 单 击 和 位 置 的 变化 。 


5.2.2 设备 和 系统 调用 
设备 不 仅 具 有 文件 和 名, 而且 支持 与 所 有 文件 相关 的 系统 调用 : open, read, write,lseek, 


close 和 stat, 


例如 ,从 磁带 污 取 数据 的 代码 如 下 、 

int fd; 

Fd = open ("/dev/tape",O RDONLY) ; /* connect to tape drive */ 
lseek (fd, (long)4096, SEEK SET); /* fast forward 4096 bytesx/ 
n = read (fd, buf, buflen); /* read data from tape */ 


close (fd); /* disconnect x/ 
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和 磁盘 文件 相关 的 系统 调用 同样 可 以 为 其 他 设备 服务 。 实 际 上 , Unix 没有 其 他 的 方法 
用 来 和 设备 通信 。 

当 你 移动 鼠标 并 按键 ,鼠标 将 数据 发 送 到 系统 ,使 得 进程 能 够 读 取 它 们 。 向 设备 写 人 数 
据 意味 着 什么 呢 ? 发 送 数 据 到 鼠标 ,不 会 使 鼠标 移动 ,也 不 会 使 眼 标 的 链 钼 按 下 。 
/dev/mouse 文 件 不 支持 所 有 的 write 系统 调用 。 当 然 ; 可 以 制造 带 有 发 动机 的 鼠标 ,然后 编 
写 一 个 更 高 级 的 鼠标 驱动 程序 ,使 得 系统 能 够 接受 并 产生 鼠标 事件 ， 

终端 支持 read 和 write. {HA A WHF lseek。 考 虑 一 下 这 是 为 秆 么 呢 ? 


5.2.3 Bit: 终端 就 像 文 件 


Unix 的 很 多 用 户 输入 来 自 终端 。ttysd ,ttyse 等 文件 都 代表 终端 。 按 传统 定义 终端 是 键 
竹 和 显示 单元 ,但 实际 可 能 包括 一 个 20 世纪 70 年 代 生 产 的 打印 机 、 一 个 键盘 和 一 个 串 行 接 
口 的 显示 器 ,或 是 一 个 调制 解 调 器 和 通过 拨号 上 网 的 软件 。 在 因特网 登录 的 telnet 或 ssh F 
口 也 可 以 认为 是 一 个 终端 。 终 端 最 重要 的 功能 是 接受 来 自用 户 的 字符 输入 和 将 输出 信息 显 
示 给 用 户 。 显 东 输 出 单元 甚至 可 以 产生 育 文 打 印 或 声音 。 

命令 uy 用 来 告知 用 户 所 在 终端 的 文件 名 。 用 终端 文件 做 以 下 试验 : 


$ tty 
/dev/pts/2 
5 cp /etc/notd /dev/pts/2 
Today is Monday, we are running low on disk space. Please delete files. 
- your sysadmin 
5 who => /dev/pts/2 
bruce pts/2 Jul 17 23;35 (ice,.northpole. org) 
bruce  pts/3 Jul 18 02;03 (snow.northpole. org) 
$ ls — li /dev/pts/2 
4  crw-—w--w- 1 bruce tty 136, 2 dul 18 03:25 /dev/pts/2 


从 以 上 输出 可 以 知道 ,终端 tty 06] hz P) eR OE A /dev/pts/2. RI UU I XC frd 
几 任 何 与 文件 相关 的 命令 和 进行 任何 文件 操作 ,如 cp BEARS” mvLIn irm. cat at ls 等 
各 种 命令 。 

命令 cp 从 普通 文件 /etc/motd 中 读 取 数据 ,向 设备 文件 /dev/pts/2 写 人 数据 ,使 得 内 
容 能 够 显示 在 屏 右 上。 写作 设备 文件 就 是 向 设备 写 人 字 节 ,例子 中 的 下 一 行 表明 将 带 有 
FA SE [nF “o>” A who 的 输出 内 容 发 送 到 /dev/pts/2， 并 将 数据 以 字符 的 形式 显示 在 屏 
FEY, 


5.2.4 设备 文件 的 属性 
设备 文件 具有 磁盘 文件 的 大 部 分 属性 。 上 面 ls 的 输出 内 容 表 明 ,/ dev/jpts/2 AA i- pA 
4 BL frg rw--w--w- ;1 个 链接 ,文件 所 有 者 bruce 和 组 tty; 最 提 修 改 时 间 是 Jul 18 at 


中 这 有 点 像 百 人 用 的 点 字 法 。 
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03,25。 文 件 类 型 是 “ec” ,表示 这 个 文件 实际 上 是 以 字符 为 单位 进行 传送 的 设备 。 权 限 位 看 起 
来 有 点 奇怪 ,表达 式 136,2 显示 在 表示 文件 大 小 的 地 方 , 它 有 什么 特殊 的 含义 呢 ? 

C1) 设备 六 件 和 文件 大 小 

常用 的 磁盘 文件 由 字 节 组 成 ,磁盘 文件 中 的 字 节 数 就 是 文件 的 大 小 。 设 备 文件 是 链接 ， 
而 不 是 容器 。 键 盘 和 鼠标 不 存 情 币 键 数 和 点 击 数 。 设 备 文件 的 i- 节 点 存储 的 是 指向 内 核子 
程序 的 指针 ,而 不 是 文件 的 大 小 和 存储 列表 。 内 核 中 传输 设备 数据 的 子 程序 被 称 为 设备 驱 
动 程序 。 

f£ / dev/pts/2 这 个 例子 中 ,从 终端 进行 数据 传输 的 代码 是 在 设备 一 进程 表 中 编号 为 136 
的 子 程序 。 该 子 程序 接受 一 个 整 型 参数 。 在 /dev/pts/2 中 ,参数 是 2。136 410 2 这 两 个 数 被 
称 为 设备 的 主 设备 号 和 从 设备 号 。 主 设备 号 确定 处 理 该 设备 实际 的 子 程序 ,而 从 设备 号 被 
”作为 参数 传输 到 该 子 程序 。 

(2) 设备 文件 和 权限 位 

每 个 文件 都 有 相应 的 读 . 写 和 执行 的 权限 。 当 文件 实际 上 表示 设备 时 ,权限 位 表示 什么 
意思 呢 ? 向 文件 写 人 数据 就 是 把 数据 发 送 到 设备 ,因此 ,权限 写意 味 着 允许 向 设备 发 送 数 
据 。 在 这 个 例子 中 ,文件 所 有 者 和 组 uy 的 成 员 拥 有 写 设备 的 权限 ,但 是 只 有 文件 的 所 有 者 
有 读 取 设备 的 权限 。 读 取 设 备 文 件 就 像 读 取 普通 文件 一 样 ,从 文件 获得 数据 。 如 果 除 了 文 
件 所 有 者 还 有 其 他 用 户 能 够 读 联 /dev/pts/2, 那 么 其 他 人 也 能 够 读 取 在 谈 键 骸 上 输入 的 字 
Ar , 读 取 其 他 人 的 终端 输入 会 引起 某 些 麻烦 ， 

另 一 方面 ,向 其 他 人 的 终端 配 人 字符 是 Unix 中 write 命令 的 目标 ， 


5.2.5 编 与 write 程序 


在 即时 消息 和 聊天 室 出 现 之 前 , Unix 用 户 通过 使 用 命令 write 和 在 其 他 终端 上 的 用 户 
WK: 


$ man 1 write 
WRITE( 1) Linux Programmer's Mannual WRITE(1) 
Name 
write — send a message to another user 
SYNOPSIS 
write user | ttyname | 
DESCRIPTION 
Write allows you to communicate with other users by copying lines from you terminal to 
theirs. 
When you run the write command, the user you are writing to gets a message of the form: 


Message from yourname(Z yourhost on yourtty at hh :mm 


Any further lines you enter will be copied to the specified user's terminal. If the nther user 
wants to reply, they must run write as well. 
When you are done, type an end — of - file or interrupt character. The other user will see the 


message EOF indicating that the conversation is over. 
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息 ,并且 需 要 的 参数 是 终端 的 文件 名 (ttyname) ,而 不 是 其 他 人 的 用 户 名 : 


/* writed.c 
x 
* purpose; send messages to another terminal 
* method: open the other terminal for output then 
* copy from stdin to that terminal 
* — Shows; a terminal is just a file supporting regular i/o 
* — usage; writed ttyname 
xf 
H include <stdio.h> 
# include — «fentl.h-- 
main( int ac, char # av| |} 
i 
iut. Íd; 
char buf[ BUFSI1Z |; 
/* check args x*/ 
if (ac !- 2 ){ 
fprintf(stderr, "usage; write? ttyname\n"); 
exit(1); 
: 
/* open devices »/ 
fd = open( av|1], O WRONLY ) ， 
if (fd == -1)! 
perror(av[1]); exit(1); 
; 
/* loop until EOF on input */ 
while( fgets(buf, BUFSIZ, stdin) !* NULL ) 
if { write(fd, buf, strlen(buf)) == -1) 
break; 
close( fd); 
j 
仔细 阅读 这 段 代码 ,在 这 里 找 不 到 键盘 连接 到 其 他 用 户 屏幕 所 需 的 特殊 特征 。 这 个 简 
单 的 write 程序 将 一 个 文件 的 内 容 一 行 行 地 复制 到 另 一 个 文件 。 这 个 例 程 和 前 面 章节 中 的 
例子 表明 终端 就 像 其 他 连接 到 Unix DL AR ES Ve A — FF ,能 够 以 磁盘 文件 的 方式 锌 处理 。 


5.2.6 设备 文件 和 和 i- 节操 


这 些 设 备 文件 是 如 何 工 作 的 呢 ? Unix 文件 系统 的 i- 节点 和 数据 块 是 如 何 支 持 设 备 文 
件 这 个 概念 的 ?图 5. 1 显示 了 它们 之 间 的 关系 。 

目录 是 文件 名 和 I-TPRS WAR, 目录 并 不 能 区 分 哪些 文件 名 代表 议 盘 文件 ,哪些 文 
件 名 锚 表 设备 。 文 件 类 型 的 区 别 体现 在 1 一 节 点 上 。 


第 5 章 PRR, #7 suy » 129 * 














i- PAE f E "TM wane l s 
"UOS a thane 
据 块 的 指针 动 器 的 指针 

的 列表 


= = 
Aa | 
4 he m |] 
Leda un 
= A yi (pz. 
A x ed up 


Pd 5.1 指向 数据 块 或 驱动 器 的 1 节点 







每 个 1- 节 点 编号 指向 1- 节 点 表 中 的 一 个 结构 。1- 节 点 可 以 是 磁盘 文件 的 ,也 可 以 是 设 
备 文 件 的 。i- 节 点 的 类 型 被 记录 在 结构 stat 的 成 员 变 量 st_mode 的 类 型 区 域 中 。 

位 盘 文 件 的 1~- 节 点 包含 指向 数据 鼎 的 指针 。 设 备 文件 的 1- 节 点 包含 指向 内 核子 程序 
表 的 指针 。 主 设备 身 用 于 告知 从 设备 读 取 数据 的 那 部 分 代码 的 位 置 。 

考虑 一 下 read 是 如 何 工作 的 。 内 核 首 先 找 到 文件 描述 符 的 ji- 节点 ,该 1- 节 点 用 于 告 激 
内 核 文件 的 类 昏 。 如 果 文 件 是 磁盘 文件 ,那么 内 核 通过 访问 块 分 配 表 来 读 取 数据 。 WORE 
件 是 设备 文件 ,那么 内 核 通 过 蝎 用 该 没 备 驱动 程序 的 read 部 分 来 谈 取 数据 。 其 他 的 操作 , 例 
如 open, write, lseek 和 close 等 都 是 类 似 的 ， 


5.3 设备 与 文件 的 不 同 之 处 


磁盘 文件 和 设备 文件 都 有 文件 名 和 属性 ,从 表面 上 看 很 类 似 。 系统 调用 open 用 于 创建 
与 文件 和 设备 的 连 捞 。 但 是 与 位 盘 文 件 的 连接 不 同 于 cae 图 5.2 显示 了 带 有 两 
个 文件 描述 符 的 进程 ,一 个 是 到 获 盘 文件 的 连接 , 另 一 个 是 到 终端 用 户 的 连接 。 





uen "ac 4 
E B. 波 特 
磁盘 文件 有 缓冲 区 BRA T 






5.2 拥有 两 个 文件 描述 的 进程 
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现在 已 经 了 解 了 一 些 关 于 连接 的 内 部 情况 。 与 磁盘 文件 的 连接 通常 包含 内 核 级 冲 区 。 
从 进程 到 磁盘 的 字 节 先 被 缓冲 ,然后 才 从 内 核 的 缓冲 区 被 发 送出 去 。 磁 盘 连 接 具 有 缓冲 这 
样 一 个 属性 。 到 颖 端的 连接 则 不 同 ,进程 需要 尽快 把 到 终端 的 数据 传送 出 去 ， 

与 终端 或 调制 解 调 器 的 连接 也 具有 属性 。 连接 拥有 波 特 率 .奇偶 位 .暂停 位 的 个 数 。 一 
般 情 况 下 所 输入 的 字符 都 会 显示 在 屏幕 上 ,但 是 有 些 时 候 , 例 如 当 输 人 密码 时 .字符 并 不 同 
显 在 屏幕 上 . 回 显 字符 不 是 键盘 任务 的 一 部 分 ,也 不 是 程序 应 该 做 的 ! 回 显 是 连接 的 一 个 局 
性 .到 磁盘 文件 的 连接 没有 这 些 属 性 。 


连 授 属性 和 控制 


Unix 让 文件 和 设备 既 有 相似 之 处 ,又 有 不 同 之 处 。 与 夏 盘 文件 的 连接 不 同 于 与 调制 解 
调 器 的 连接 。 关 于 连接 的 属性 可 以 问 ，: 

|l. 连接 可 有 哪些 属性 ? 

2， 如 何 检 测 当 前 的 属性 ? 

3 如何 改变 当前 的 属性 ? 

下 面 介绍 两 例 : GEO ETE m US o ET INTE. 


5.4 ”人 磁盘 连接 的 属性 


RSA open 用 于 在 进程 和 磁盘 文件 之 间 创 建 一 个 连接 。 该 连接 含有 若干 个 属性 .下 
面 先 任 纲 学 习 其 中 的 两 个 属性 .然后 再 了 解 一 下 其 他 的 属性 ， 


5.4.1. 属性 1: Bi 


图 5. 3 显示 了 当 两 个 管道 通过 一 个 进程 单元 连接 时 文件 描述 符 的 情况 。 那 个 进程 单元 
二 用 来 进行 级 冲 和 完成 其 他 进程 任务 的 。 在 方 能 出 的 是 控制 变 基 ,用 以 决定 文件 描述 符 应 


该 采取 哪个 进程 步骤 。 
= z feo Shoe 
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dgis 制 驱动 器 如 何 运作 





5.3. 数据 流 中 的 进程 单元 


可 以 通过 修改 控制 变量 改变 文件 描述 符 的 动作 。 例 如 ,通过 简单 的 3 AR EXE BHL UE RE 
站 ,如 图 5.4 R. 
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图 5.4 修改 文件 描述 符 的 运作 


首先 ,生成 一 个 系统 调用 将 控制 变量 从 文件 描述 符 复 制 到 进程 。 然 后 ,修改 这 个 复制 过 
来 的 控制 变量 。 最 后 ,将 修改 过 的 值 送 回 内 核 . 新 的 设置 被 安 痪 在 进程 代码 中 :内 核 根 据 新 
的 设置 处 理 数 据 。 下 面 是 遵循 上 述 3 步 的 代码: 


d include <fentl. b> 


int s; //settings 

s = font} ifd, F GETFL) ; get flags 

s | = O SYNC; //set SYNC bit 

result = fcntl (fd, F SETFL, s); //set flags 

if € result == 1) //if error 
perror ("setting SYNC"); //report 


XETRA RBE PP. A SCV FB fent 通过 读 写 该 整数 位 来 控制 
文件 描述 符 ， 


fenil 
— B5 控制 文件 描述 符 
Xx d # include < fentl, h> 


# include < unistd. h> 
# include < sys/types. h> 


By & m uU int resalt = fentlCint fd, int cmd); 

int result = fentl(int fd, int cmd, long arg); 

int result = fentlCint fd, int cmd, struct Hock * lockp); 
参数 (d 需 控制 的 文件 描述 符 


cmd ) 需 进行 的 操作 
arg ”操作 的 参数 
lock "MFD 

返回 值 一 1 “过 到 错误 
other 依 操作 而 定 


fent) 在 fd 所 指定 的 文件 上 执行 操作 cmd, arg 代表 操作 cmd 所 使 用 的 一 个 参数 。 在 上 
例 中 ,参数 F_GETFL 得 到 当前 的 位 集 ( 也 就 是 flags). it s 存放 这 个 flag 集 。 位 逻辑 或 
操作 打开 位 OQ_SYNC。 该 位 告诉 内 核 ,对 write 的 调用 仅 能 在 数据 写 人 实际 的 硬件 时 才能 返 
[a] ,而 不 是 在 数据 复制 到 内 核 缓 冲 时 就 执行 默认 的 返回 操作 。 
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最 后 ,把 修改 过 的 设置 返回 内 核 . 将 F_SETFI. 操作 作为 第 二 个 参数 ,将 修改 过 的 议 置 
作为 第 三 个 参数 。 这 3 个 步骤 (从 内 核 中 读 取 设 置 到 变量 ,修改 这 些 设置 ,将 设置 返回 内 核 ) 
是 Unix 中 读 取 和 修改 连接 属性 的 典型 方法 。 

设置 0_SYNC 会 关闭 内 核 的 缓冲 机 制 , 如 果 没 有 很 充分 的 理由 ， 最 好 不 要 关闭 缓冲 。 


5.4.2 属性 2: 自动 添加 模式 


文件 描述 符 的 另 一 个 属性 是 自动 添加 模式 (auro-append mode). AR MRR FS 
干 个 进程 在 同一 时 间 写 人 文件 是 很 有 用 的 。 

为 什么 自动 添加 是 有 用 的 ? 

考虑 日 志文 件 wimp, wimp 存储 所 有 的 登录 和 退出 记录 。 当 一 个 用 户 登 录 时 ,程序 
login Æ wtmp 的 末尾 追加 一 条 登录 记录 。 当 一 个 用 户 退 出 时 ,系统 在 wimp 的 本 尾 追加 一 
条 退出 的 记录 ,如 同系 统 维护 的 日 记 一 样 。 这 就 像 人 们 写 日 记 一 翌 ,每 篇 都 被 添加 在 末尾 . 

不 能 使 用 Iseek 在 末尾 进行 添加 记录 叹 ” 考 虚 一 下 登录 的 逻辑 ,如 图 5, 5 所 示 。 


用 如 下 系统 调用 将 数据 
Adm : 


lseek (£0,0,SEEK END); 
write (fd,&rec,len); 





5.5 用 lseek 和 write 进行 添加 


seek 将 当前 位 置物 到 文件 的 末尾 ,然后 添加 登录 的 记录 。 这 里 会 产生 什么 匀 误 呢 ? 
如 果 两 个 人 同时 登录 将 会 发 生 什 么 ? 含有 时 间 过 程 ., 如 图 5.6 rm. 


idi 用 户 A 登录 | FAAP BRR 


b. lseek (fd, 0, SEEK_END) ; 


2° 1seek!£d, 0,SEEK_END) ; 


3 - write(tci,&rec,len!j 


4° write[fd,kxec, ien): 


图 5.6 Iseek 和 write ff 5| #2 038 aL 


wimp SE Sj o dE PL ET 335 Z5 3 Hams 4 SETA. APA 登录 的 代码 
显示 在 左边 AP BXuxBMUCE miu. DREAIL—WRIERS? —TFRRNSS 
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ee ee ———— —MÓMMMMUUMM. «i — —— 


Suck (EUER T ibi ; 

。 时 间 1 -8 的 登录 进程 定位 文件 的 末尾 

HH 2 一 8 的 时 间 片 用 完 ,A 的 登录 进程 定位 文件 的 末尾 

。 时 间 3 一 A 的 时 间 片 用 完 ,B 的 登录 进程 写 人 记录 

。 时 间 4 一 B 的 时 间 片 用 完 ,A 的 登录 进程 写 人 志 录 

因此 ,A 的 登录 进程 写 人 的 i 记录 和 覆盖 了 B 的 记录 ,B 的 登录 记录 丢失 ， 

这 种 情况 被 称 为 竞争 (race condition) 。 这 两 个 进程 所 共享 的 网 状 效应 依赖 于 这 两 个 进 
程 旭 何 规划 。 在 时 间 廊 面 做 一 个 小 的 改动 ,可 能 A 的 登录 记录 会 丢失 ,可 能 两 个 都 不 会 
BK, | 
如 何 避 免 这 种 竞争 ?” E E EU BOR. Ep ER UE SCR FR TES 9 CORE Jn] RT Fs FER 
需要 多 次 回 到 这 个 话题 。 在 这 个 特定 的 情况 中 ,内核 提供 一 个 简单 的 解决 办 法 : 自动 添加 模 
式 。 当 文件 描述 符 的 O_APPEND 位 被 开启 后 ,每 个 对 write 的 调用 自动 调用 leek 将 内 容 
添加 到 文件 的 末尾 ， 

下 面 的 代码 启动 自动 添加 模式 ,然后 调用 write. 


H include <(fcntl. h> 


int 9; //settings 
s = fcntl( fd, F_GETFL); //qet flags 
s |= O APPEND; //set APPEND bit 
result = fcntl ( fd, F_SETFL, s); //set flags 
if ( result == -1) //if error 
perror ( "setting APPEND"); // report 
else 
write (fd, &rec, 1); //wrikte record at end 


术语 竞争 和 原子 操作 (tatomoc operation) HOAX. Xf Iseek 和 write 的 调用 是 独立 的 
系统 调用 ,内核 可 以 随时 打 断 进程 ,从 而 使 后 面 这 两 个 操作 被 中 新 。 当 0 APPEND 被 置 位 ， 
内 核 将 Iseek 和 write 组 合成 一 个 原子 操作 ,被 连接 成 一 个 不 可 分 割 的 单元 。 


5.4.3 FH open 控制 文件 描述 符 


O SYNC 和 O APPEND 是 文件 措 述 符 的 两 个 属性 ,其 他 的 晨 性 将 在 后 面 的 章节 中 讨 
i£. fentl 的 联机 帮助 列 册 了 你 的 系统 上 所 文 持 的 所 有 选项 和 操作 。 

fent] 并 不 是 仅 有 的 昨 来 设置 文件 描述 符 属 性 的 方法 。 通 常 在 打开 一 个 文件 时 ,应 该 知 
道 需 要 怎样 的 设置 。 可 以 通过 系统 调用 open 的 第 二 个 参数 的 一 部 分 来 设置 文件 描述 符 的 属 
性 位 。 例 如 ,调用 : 


fd = open ( WIMP FILE, O WRONLY | O APPEND | O SYNC); 


以 写 方式 打开 文 件 wtmp 并 将 O_APPEND fü O, SYNC 位 开启 。open 的 第 二 个 参数 不 
只 是 读 、 写 或 读 / 写 的 选择 。 
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例如 ,可 以 通过 open 创建 一 个 包含 O_CREAT 标志 位 的 文件 。 以 下 两 个 洞 用 是 等 
价 的 ; 


fd = creat ( filename, permission bits); 


fd = open ( Filename, O CREAT | O TRUNC ' O WRONLY, permission bits); 


为 什么 open 可 以 实现 相同 的 功能 ,而 creat KETE? AZ RRA, open 仅仅 用 来 打 
开 文 件 ,creat 用 来 创建 新 的 文件 。 随 后 open 被 多 次 修改 以 支持 更 多 的 标志 位 ,包括 创建 文 
件 选 项 。 

open X Nr BS fib Es f: 


O_CREAT “如果 不 存在 ,创建 该 文件 ， 可 查看 O0 EXCL, 
O TRUNC 如果 文 件 存 在 ,将 文件 长 度 管 为 0。 
O EXCL EXCL 标志 位 防止 两 个 进程 创建 间 样 的 文件 。 如 果 文 件 存 在 且 0_EXCL 被 置 位 , 则 返回 1。 


O_CREAT 和 O EXCL 的 组 合用 来 消除 以 下 竞争 情况 : 如 果 两 个 进程 同时 创建 相同 的 文 
件 将 会 发 生 什 么 情况 ?例如 ,如 果 丙 个 进程 都 要 写 wimp, 但 是 这 个 文件 不 存在 时 ,都 要 创建 该 
文件 ,此 时 会 发 生 什 么 情况 ? 程序 能 够 先 调用 stat 查看 文件 是 否 存 在 ,如 果 不 存 在 ,就 调用 
creat。 当 stat 和 crear [BI] E Re 8x 37 BEI) 1o] ELSE HL EL P, O_EXCL/O_CREAT 的 组 合 将 这 两 
个 泗 用 构成 了 一 个 原子 操作 。 虽 然 想 法 很 好 ,但 是 这 种 方法 在 某 些 重要 场合 并 不 可 行 。 一 个 可 
靠 的 替代 方案 是 使 用 Jnk。 本 章 的 练习 提供 了 一 个 例子 。 


5.4.4 磁盘 连接 小 结 


内 局 在 磁 南 和 进程 间 传 输 数 据 。 内 核 中 进行 这 些 传 得 的 代码 有 很 多 选项 。 程 序 可 使 用 
open 和 fent) 系统 调用 控制 这 些 数据 传输 的 内 部 运作 ,如 图 5.?7 Pro. 


MPF ET 





AS.7 与 义 件 的 连 按 县 有 属性 设置 
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5.5 终端 连接 的 属性 


系统 调用 open 在 进程 和 终端 之 间 创 建 一 个 连接 现在 来 仔细 了 解 一 下 与 终端 连接 的 一 
些 属 性 。 


5.5.1 终端 的 1/O 并 不 如 此 简单 


终 贿 和 进程 之 加 的 连接 看 起 来 简单 。 通 过 使 用 getchar 和 putchar 就 能 够 在 设备 和 进程 
间 传 答 字 节 。 数 据 流 的 这 种 抽象 使 得 键盘 和 屏幕 看 起 来 就 像 在 进程 中 一 样 ,如 图 5.8 R. 





图 5.8 一 个 简单 .直接 连接 的 流程 


一 个 简单 的 实验 表明 这 个 模型 并 不 完整 。 考虑 以 下 这 个 程序 ; 


/* listchars,c 
* purpose: list individually all the chars seen on input 
|^ output: char and ascii code, one pair per line 
" input; stdin, until the letter Q 
* notes: usesful to show that buffering/edíting exists 
x/ 
H include <stdio.h> 
nain() 
| 
intc,n = Q; 
while( ( c = getchar()) I= 'Q') 
printf("char % 3d is kc code d\n", ntt ,c, c); 
} 


这 个 程序 以 一 个 接 一 个 的 方式 处 理 字符 ,该 取 字符 ， 打印 数值 .字符 本 身 以 及 它 的 内 部 
代码 。 编 坚 并 运行 这 个 程序 ,结果 如 下 所 示 ， 


S ./listchars 
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hello 

char 6 is h code 104 
char ) 15 e code 101 
char 2 is l code 108 
char 3 1s ! code 108 
char 4 is o cade 111 
char 5 is 

code 10 

Q 

$ 


接 下 来 会 发 生 什 么 事情 ? 如 果 字 符 代 码 直 接 从 键盘 流向 gerchar, 则 在 每 个 字符 后 可 看 
到 一 个 响应 。 答 人 单词 hejlo 中 的 5 个 字符 并 按 回 车 键 。 然 而 仅 在 这 个 时 候 , 程 序 才 着 始 处 
理 这 些 字符 。 输 入 看 起 来 被 缓冲 了 。 就 像 流 向 磁盘 的 数据 ,从 终端 流出 的 数据 在 沿途 中 的 
某 个 地 方 被 存储 起 米 了 。 

listchars 显示 了 另外 一 些 内 容 。Enier BR Return 键 通常 发 送 ASCII 码 13, 即 回 车 符 。 
lisrchars 的 输出 显示 ASCH 码 13 被 换行 符 ( 代 码 ORNER. 

第 三 种 处 理 影响 程序 的 输出 。listchars 在 每 个 字符 串 的 末尾 添加 一 个 换行 符 (\n)。 质 
行 符 代 码 告诉 鼠标 移 到 下 一 行 , 但 没有 告诉 它 移 到 最 左边 。 代 但 13( 回 车 符 ) 告 许 鼠 标 回 到 
RAH, 

运行 listebars 表明 在 文件 描述 符 的 中 间 必 定 有 一 个 处 理 层 。 图 5.9 显示 了 该 层 的 部 分 
EH. 


E 


+ gelchar putchar 
d 口 | 
: o j | 












程序 发 送 \n', 但 
ig gom enis 2l 
Ve Al ‘\n'. 
用 户 输入 Ar'， 
iH BREF pier By] 


"ln. 


"r'char 
图 5.9 内 核 处 理 终端 数据 


这 个 例子 说 明了 3 种 处 理 

]. 进程 在 用 户 输 人 Return AARRE: 

2. 进程 将 用 户 输 人 的 Return( ASCII I 13) 看 作 换 行 符 (ASCI] 码 10); 
3. 进程 发 送 换行 符 ,终端 挡 收 回 车 换行 符 .。 


DO PRR p] His 039 4S A8 REED T VE T] o UL C HE Ze FS A [6E RI AC 7c I. 


第 5 章 ”连接 控制 : 学 习 sty . 137 . 





与 终端 的 连接 包含 一 套 完 整 的 属性 和 处 理 步 又。 
5.5.2 终端 驱动 程序 
终端 种 进程 之 间 的 连接 如 图 5. 10 所 示 。 








f 5.10 终 问 驱动 器 是 内 核 的 一 部 分 


处 理 进程 和 外 部 设备 间 数 据 流 的 内 核子 程序 的 集合 被 称 为 终端 驱动 程序 或 tty Soe 
序 出 。 驱 动 程序 包含 很 多 控制 设备 操作 的 设置 。 进 程 可 以 读 . 修 改 和 重 置 这 些 驱动 控制 
Er ds. 


8.5.3 stty 命令 


stty 命令 让 用 户 读 取 和 修改 终端 驱动 程序 的 设置 。 
(1) 使 用 suy 显示 驱动 程序 设置 
stty 的 输出 如 下 所 未 : 


S stty 

speed 9600 baud; line = O0; 

$ stty - all 

speed 9600 baud; rows 15; columns B0; line = O; 

intr = ^C; quit = ^X; erase = ^7; kill = ^U; eof = ^D; eol = <Cundef>, 
eol2 = <lundef>; start = >Q; stop = ^S; susp = ^2; rprnt = ^R; werase = ^W; 
lnext = ^U; flush = ^0; min = 1; time = 0; 

— parenb ~ parodd csB 一 hupcl - cstopb cread ~- clocal - crtscts 

-= ignbrk brkint ignpar 一 parmrk - inpck istrip - inlcr - igncr icrnl ixon 一 ixoff 
— iuclc - ixany imaxbel 

apost ~ oleuc — ocrnl onler — onocr ~ onlret - ofill - ofdel n10 cro tabd bsO vtO FFO 
isig icanon iexten echo echoe echok ~ echonl - noflsh ~ xcase - tostop - echoprt 


QD wy 是 指 由 Teletype AES HBA En EX A, 
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— — e P. P 


echoctl echoke 


默认 选项 的 列表 很 简洁 。 如 加 上 选项 -all 则 将 列 出 更 多 的 设置 。 有 些 设 置 是 有 值 的 变 
量 , 有 些 是 布尔 值 。 例 如 , 波 特 率 和 屏幕 的 行 数 与 列 数 拥有 数值 。 像 inir.quit 和 eof REM 
拥有 字符 值 。 而 像 icrnl、-oleuc 和 onler 的 值 是 开 或 关 。 

这 些 意味 着 什么 ? icrnl 是 Input:convert Carriage Return to NewLinel 输 入 时 将 回 车 转 
换 为 换行 ?的 缩写 , 即 在 前 面 的 例子 中 些 动 程序 所 做 的 操作 。 缩 写 onler 代表 Output:add to 
NewLine a Carriage Return{ 输 出 时 在 新 的 一 行 中 加 入 问 车 )。 一 个 属性 前 的 减 导 表示 这 个 
操作 被 关闭 。 例 如 ,一 olcuc 表示 动作 Output:convertl LowerCase to Upper(Case( 输 出 时 将 小 
写字 母 转换 成 大 瑟 }) 被 禁止 ， 很 多 早期 的 终端 只 显示 大 写字 母 ,所 以 那 时 将 输出 转换 成 大 瑟 
RAH., 

(2) 使 用 stty BÆIR a FEIT i - 

这 里 是 -- 些 使 用 stty 修改 驱动 程序 属性 的 例 于 ， 


$ stty erase X # make 'X' the erase key 
5 stty - echo H type invisibly 
5 stty erage (o echo + multiple requests 


在 第 一 个 例子 中 ,使 用 sty 用 来 改变 删除 键 ， 退 格 键 或 删除 键 是 典型 设置 ,但 是 可 以 将 
(MBE AMRB?. ESTAT PT AMER. SARIN SHA BE 
幕 上 。 关 团 这 个 回 显 意 味 着 能 够 打字 ,但 是 看 不 到 所 输入 的 字符 。 在 第 三 个 例子 中 ,使 用 
stty TRH RE SHIRE. WO SAR RAH ES ,并 将 回 显 模式 开局 。 

stty 如 何 运作 ? 现在 能 够 编写 stty 了 吗 ? 


5.5.4 编写 终端 驱动 程序 : 关于 设置 


tty 驱动 程序 包含 很 密 对 传人 的 数据 所 进行 的 操作 。 这 些 操作 被 分 为 上 种， 

， 输 入: 驱动 程序 如 何 处 理 从 终端 来 的 宁 符 

e 输出 : 驱动 程 订 如 何 处 理 流向 终端 的 字符 

。 控制 : 宇 符 如 何 被 表示 一 -位 的 个 数 .位 的 奇偶 性 .停止 们 等 

« 本 地 ; SR oh tS Ae an fey ab HR A E EP A ABBY Sf | 

Mi A RPER BI EE DS FRRRARKRSE CK Bb. 去除 最 幢 位 及 将 回 车 符 转 换 为 换行 符 。 答 
出 处 理 包 括 用 若干 个 空格 符 代 替 制 表 符 ,将 换行 符 转 换 为 回 车 符 及 将 小 写字 母 转换 为 大 写 
字母 。 控 制 设 君 包 括 奇 倍 性 及 停止 位 的 个 数 。 本 地 钼 理 和 包括 回 显 字符 给 用 户 及 缓冲 输入 直 
到 用 户 按 回 车 键 。 

除了 于 和 关 设 置 外 ,驱动 程序 维护 了 一 张 会 有 特殊 意义 键 的 列表 。 例 如 ,用 户 可 能 按 退 
格 键 来 删除 一 个 字符 。 和 终端 张 动 程 序 会 注意 并 处 理 这 个 删除 键 ， 除 此 之 外 ,终端 驱动 程序 
还 负责 对 其 他 一 些 控制 字符 进行 处 理 。 

联机 帮助 上 列 出 了 stty AaB ot EY BY E Ae H SF o 


— ` n 








东部 分 Unix shell 4k BUE op T E e PE EE SL FE E R AY TE BE ,而 不 在 驱动 程序 中 处 理 此 命令 ， 
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5.5.5 SURREY: 关于 函数 


Be ak £4 ely SR 5 FE AS CELLA. aD a SF e dE gi —: 
(OD 从 驱动 程序 获得 属性 ; 

(2) 修改 所 要 修改 的 属性 ; 

(3) 将 修改 过 的 属性 送 回 驱动 程序 。 

例如 ,以 下 代码 为 一 个 连接 开局 字符 回 显 : 


2 include < rermios.h — 


struct termios attribs; /* struct to hold attributes */ 
tcgetattr ( fd, &settings); ‘x get attribs From driver x/ 
settings.c lflag | = ECHO; * turn on ECHO bit in flagset */ 


rtcsetattr ( fd, TCSANOW, Ssettings); /* send attribs back to driver */ 


通常 的 过 程 在 图 5. 11 rnyETTB E. 


t include < termios. h> 
struct termios Settings.: 
tcgetartr( fd. £sottings); 


/* test. set, or 
clear bits «/ 


tesetattr( fd. how, &serrings): 





图 5.11 调用 tcgetattr 和 tesetatir $F Ra 88 


HE e& tegetatir 和 tesetatir HE ERT 28 9g Mae lel. PP RARE termios 结构 中 
交换 设置 。 以 下 是 详细 描述 。 


tegetattr 

目标 读 取 uy 驱动 程序 的 属性 
头 文 件 H include Ztermios, h> 

B include <_unistd, h> 
奋 数 原型 int result = tegetattr(int fd, struct termios * info); 
参数 fd 45 7 HK B5 X PE ETE 

mío 指向 终端 结构 的 指针 0 
Bam -1 ASH 


0 成 功 返 回 


— —————á— vá ST — 'u€—— n 
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tegetattr 从 与 文件 fd 相关 的 终端 驱动 程序 中 获取 当前 设置 ,并 把 它 复 制 到 info 指针 所 








措 的 结构 中 ， 
tesetattr 
目的 UB tty 驱动 程序 的 属性 
Aw fE # include «termios, h> 
= # include << unistd. h> 

a r BY | int result 一 tcsetattrCinti fd, int me struct termios # info); 
BH [d H3 28 ng THER A) C PETS XR AF 

when 改变 设置 的 时 间 

info 指向 终端 结构 的 指针 
返回 值 s] 3B 3| iR 

0 ES, za [a 


tesetatir 从 info 所 指 的 结构 中 将 驱动 程序 的 设置 复制 到 与 文件 fd 相关 的 终端 驱动 程序 
P. when 参数 告诉 tesetattr 在 什么 时 候 更 新 驱动 程序 设置 。when 的 允许 值 如 下 所 示 。 


(1) TCSANOW 
立即 更 新 驱动 程序 设置 ， 


(2) TCSADRAIN 
AE R$ E BIE zh Ee BA h AI BC S LB a eS SR ET UE oh F B9 UM. 
(3) TCSAFLUSH 
等 待 直到 驱动 程序 队 州 中 的 所 有 输出 都 被 传送 出 去 。 然 后 ,释放 所 有 队列 中 的 输入 数 
据 , 并 进行 一 定 的 变化 。 


5.5.6 编写 终端 驱动 程序 ;关于 位 
termios 结构 类 型 包括 知 于 个 标志 集 和 一 个 控制 字符 的 数组 。 所 有 的 Unix 版 本 包含 以 


下 结构 ， 


struct termios 

! 
tcflag t 
tcflaq t 
tcflag t 
tcflag t 
po. t 
speed t 
speed t 

E 


c iflag; 
c oflag; 
c cflag; 
c lftag; 


/* input mode flags « / 
/* output mode flags x/ 
/* control mode flags */ 
/* local mode flags */ 


c cc[NOGCS |; /x control characters x/ 


c ispeed; 
c osSpeed:; 


/* input speed x/ 
/* output speed +/ 


MUR zi TU E H4 B9 2 ae O9 OE RRS FEE c_ispeed 和 c ospeed MAY, 





.. ”一 "Ca. “- 


c_iflag EF 
etg — [(TTITITIITTITTITI 


ecag | LITILILILILLLIITITI 


GOTTO 
ZL Se a m a un 
es gouges s 
dm Sava 


c Iflag 


GHSIT I4 
NIGN:d 
dOLSOL 
HS TAON 
NILXAT 
INOQHOA 
OHO 
WOOHOO 
4IMOHIA 
NOHDA 
3JOITE X4 
NONY 
DISI 


€ 
r; 
[ur 


TINTA 
TOJA 
NIWA 
JOJA 
TTTAA 
HSY HHA 
LINDA 
W.LNTA 


B 5.12 和 终端 变量 中 的 位 和 字符 


首先 描述 的 4 个 成 员 是 标志 集 。 每 个 标志 集 包 含 在 该 组 中 的 操作 位 。 例 如 ,成 员 c_iflag 
HE INLCR 值 的 位 。 成 员 c cilag RES PARODD 的 值 ,其 功能 是 设置 奇偶 性 。 所 有 这 
些 掩 码 都 定义 在 termios. bh 中。 如 从 驱动 程序 中 讯 取 当 前 的 属性 到 termios 结构 中 时 ,这 个 
结构 中 的 所 有 值 都 可 以 被 检验 和 修改 。 

成 员 ccc 是 控制 字符 的 数组 。 含 有 特殊 功能 的 键 都 被 存储 在 这 个 数组 中 。 数 组 中 的 每 
个 位 置 都 由 termios. h "PAS a EE BERE X. BR, attribs, c cc[ VERASE] = Ab" 告诉 驱动 程 
序 将 退 格 键 作为 删除 键 ， 

现在 已 经 知道 如 何 从 驱动 程序 获得 设置 和 如 何 将 设置 存 回 驱 动 程序 ,下 面 看 看 修改 红 
动 程序 属性 的 技术 . | 

每 个 属性 在 标志 集中 都 占有 一 位 。 属 性 的 掩 码 定义 在 termios. h 中 。 要 测试 一 个 属性 ， 
需要 将 标志 和 集 与 那个 位 的 掩 码 柑 与 。 要 启动 这 个 属性 ,将 该 位 开启。 要 禁止 这 个 属性 ,将 该 
位 关闭 。 上 面 的 情况 如 下 所 示 : 
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操作 tt eG 

测试 位 if € flagset & MASK)... 
Biz flagset | = MASK 

清除 位 flagset & = ~ MASK 


5.5.7 Si S28 dm JOE EE PR: 几 个 程序 例子 


l. fi. echostate, c—— € m €) X 4 d$ KA 
第 一 个 例子 说 明 终 端 是 否 征 设 置 成 回 显 字符 的 模式 。 读 取 设 置 ,测试 位 ,并 报告 结果 : 


/* echostate.c 
* reports current state of echo bit in tty driver for fd 0 


* shows how to read attributes from driver and test a bit 
xj 
+ include <stdio.h> 
Hf include — —termios.h-- 
maint } 
i 
struct termios info; 


int rv; 


rv = tegetattr( 0, Sinfo ): /* read values from driver x / 
if (rv == -1%{ 

perror( "tcgetattr"); 

exit(1); 


1 
了 


if ( info.c lflag & ECHO ) 

printf(" echo is on , since its bit is 1\n"); 
else 

printf(" echo is OFF, since its bit is O\n"); 


1 


l 


这 个 程序 为 文件 措 述 符 0 读 取 终端 属性 。0 是 标准 输入 的 文件 描述 符 LOC UE FERE 
常 附属 在 键盘 上 。 这 里 是 编译 和 运行 程序 的 一 个 例子 : 


S cc echosLate.c - o echostate 
S ./echostate 

echo is on, since its bit is 1 
$ stty - echo 

5 ./echostatr- not found 


S echo is OFF, since its bit is 0 


这 个 例子 显示 命令 stty -echo 关闭 驱动 器 里 的 击 键 回 显 。 用 户 在 这 之 后 输入 了 另外 两 
个 命令 ,但 它们 在 屏幕 上 并 不 显示 。 田 一 方面 ,对 那 两 行 的 输出 响应 仍然 显示 。 


—————— ——————— —— MM MM MM MÀ a i BIS BB BID 
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2, #) +. setecho.c are RITA IA 

第 二 个 例子 将 键盘 回 显 开 或 关 。 如 果 命 令 行 参数 以 "7 开始 ,终端 的 回 显 标志 被 开局 。 
d ER. 程序 如 下 所 未 : 

/* setecho.c 


* usage: setecho | yj n] 


* shows; how to read, change, reset tty attributes 


* 
# include < stdio.h 
Ẹ include << termios. b 


# define oops(s,x) | perror(s); exit(x); ! 


main(int ac, char x av[ ]) 


i 


struct termios info; 


if (ac == 1) 
exit(Q); 
if ( tegetattr(0,&info) == 一 1 ) /* get attribs x/ 


oopsi"tcgettattr", 1); 


if (C av|1]:0! == tyi) 

info.c lflag | = ECHO ; jx turn on bit */ 
else 

info,c_lflag &= --ECHO - /* turn off bit «/ 
if ( tesetattr(0,TCSANOW,&info) == 1) /x set attribs «/ 


cops( "tcsetattr",2); 


i GFF is fTix mq HELLE GEH ERG tty: 


$ echostate; setecho n ; echostate ; stty echo 
echo is on, since its bit is 1 

echo is OFF, since its bit is 0 

$ stty - echo; echostate ; setecho y ; setecho n 


echo is OFF, since its bit is Ù 


在 第 一 个 命令 行使 用 setecho 关闭 回 显 。 然 后 使 用 sty 将 回 显 重新 开启。 驱动 程序 和 
驱动 程序 设 剖 锌 和 存 铺 在 皮 核 ,而 不 赵 在 进程 。 一 个 进程 可 以 改变 驱动 程序 里 的 设置 , 另 一 个 
不 同 的 进程 可 以 读 取 或 修改 设置 。 

3. 例子 : showtty. c 一 显示 大 量 驱动 程序 属性 

可 以 重复 用 setecho. c 和 echostate. c 中 的 技术 建立 一 个 完整 的 stty 版 本 。tty 驱动 程序 
ea 3 种 设置 : 特 味 字符 .数值 和 位。showtty 包含 显 示 这 些 数据 类 型 的 函数 。 以 下 是 代码 ， 





/* showtty. c 
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< displays some current tty settings 


*/ 


H include < stdio. h> 


# include <<_termios. h> 


maint) 
| 
struct termios ttyinfo: /* this struct holds tty info */ 
if ( tegetattr( 0 , &ttyinfo) == -1}{ /* get info x/ 
perror( "cannot get params about stdin"): 
exit(1); 
| 
/« show info */ 
showbaud ( cfgetospeed( &ttyinfo 5) ); /* get * show baud rate */ 


printf ("The erase character is ascii *d, Ctrl- *c\n", 
ttyinfo.c cc[VERASE], ttyinfo.c cc[VERASE]- 1 * 'At); 
printf("The line kill character is ascii &d, Ctrl- $ cin", 
ttyinfo.c cc[VKILL], ttyinfo.c cc[VKILL]-—- 1 * 'A"); 
show some flagst &ttyinfo ) ， /* show misc. flags x/ 
f 
showbaud( int thespeed ) 
/* 
* prints the speed in english 
x / 
{ 
printf( "the baud rate is "); 
switch ( thespeed }{ 
ease B300; printf£("300\n"); break; 
case B600.  printf("600Xn"); break; 
case B1200; printf("1200Xn'5. break; 
case B1800: printf("1800\n"); break; 
case B2400; printf("2400\n"); break; 
case B4800. printf("4800VXn'") ; break; 
case B9600: printf("9600\n"); break; 
default: printf("FastXn') ; break; 


j 


struct fiaginfo { int fl value; char « fl name; |; 


struct flaginfo input flags[ | = | 
IGNBRK , "Ignore break condition", 
BRKINT , "Signal interrupt on break", 
IGNPAR , — "Ignore chars with parity errors", 
PARMEK , “Mark parity errors", 
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INPCK 
ISTRIP , “Strip character", 


i "Enable input parity check”, 

INLCR , "Map NL tò CR on input", 

IGNCR , "Ignore CR", 

ICHNL , "Map CR to NL on input", 

TXON , "Enable start/stop output control", 

/* IXANY , “enable any char to restart output", «/ 
IXOFF , "Enable start/stop input control", 

D NULE |; 


f 


struct flaginfo local flags| | = | 


Isic , "Enable signals", 
ICANON , "Canonical input (erase and kill)", 
/^* XCASE 


+ 


, "Canonical upper/lower appearance", «/ 
ECHO , "Enable echo", 

ECHOE , "Echo ERASE as BS - SPACE — BS", 

ECHOK , "Echo KILL by starting new line", 


0 NULL |. 


, 


show some flags( struct termios * ttyp } 
/* 


} 


* show the values of two of the flag sets : c_iflag and c lflag 


* adding c oflag and c cflag is pretty routine — just add new 
* tables above and a bit more code below. 


» f 


show flagset( ttyp —-c iflaq, input flags ); 
show flagset( ttyp —-c lflag, local flags ); 


F 


show flagset( int thevalue, struct flaginfo thebitnames[ ! ) 
fx 


i 


x check each bit pattern and display descriptive title 


, 


其 了 


int i: 

for (i70; khebitnames| i]l.fl value ; i++ > { 

printf( " & s is ", thebitnames[ i].fl, name); 

if { thevalue & thebitnames[ i]. fl value) 
printf("ONin"): 

else 


printf( "OFF\n") ; 
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showtty FASE td zr IK RR Bl 16 个 属性 的 当前 状态 ,并 附 有 注释 。 程 序 使 用 了 结构 表 
以 简化 代码 。 一 个 简单 的 函数 show flagset 接收 一 个 整数 和 驱动 程序 标志 和 集 。 如 在 这 个 程 
序 中 增加 其 他 的 标志 集 需 要 些 什 么 呢 ? 将 这 个 程序 转换 成 完整 版 本 的 sty v ER IET] AE? 


5.5.8 终端 连接 小 结 


终端 是 人 们 用 来 和 Unix 进程 进行 道 信 的 设备 。 终 端 拥有 一 个 可 以 让 进程 读 取 字符 的 
键盘 和 可 让 进程 发 送 宁 符 的 显示 莫 。 终 端 是 一 个 设备 ,所 以 它 在 目录 树 中 表现 为 一 个 特殊 
的 文件 ,通常 在 /dev 这 个 目录 中 。 

进程 和 终端 则 的 数据 传输 各 数据 灶 理 出 终端 驱动 程序 人 希 页 ,终端 驱动 程序 是 内 核 的 一 
部 分 。 该 内 核 代 码 提供 缓冲 .编辑 和 数据 转换 。 程 序 可 通过 调用 tegetattr 和 tesetattr 查看 
和 修改 该 驱动 程序 的 设置 ， 


5.6 其 他 设备 编程 : ioctl 


到 磁盘 文件 的 连接 有 一 个 属性 集 , 到 终端 的 连接 有 另外 一 个 属性 集 。 到 其 他 类 型 设备 
的 连接 是 怎样 的 呢 ? | 

考虑 CD 刻录 机 。 可 擦 写 的 CD ARMENA, 能 以 不 同 的 速度 刻录 CD, AERA 
自己 的 设置 ,如 解析 度 和 颜色 深度 等 。 其 他 类 型 的 设备 有 各 自 的 属性 集 。 程 序 员 如 何 查 看 
和 控制 一 个 设备 的 设置 呢 ? 

每 个 设备 文件 邦 支 持 系 统 调用 ioctl: 











ioctl 

目标 O o ”控制 一 个 设备 
头 文件 st include < sys/ioctl. h 
e Re Ir 2 int result = ioctl Cint fd, int operation [. arg... | 2; 
$ fd 与 设备 相 联 的 文件 描述 符 

Operation ”入 进行 的 棵 作 

arg... BR +E ON is SUN | 
i [n] fa 一 1 AUS UR 


系统 调用 ioctl) 提供 对 连接 到 fa 的 设备 张 动 程序 的 属性 和 操作 的 访问 。 答 种 类 型 的 设 
备 都 有 自己 的 属性 集 和 ioctl BFE. 

例如 ,一 个 终端 屏 磋 ,有 一 个 以 行 和 列 或 者 是 以 像 罕 为 单位 的 大 小 属性 。 下面 的 代码 最 
m BERE RT. 


tinclude  «2sys/ioctl.h- 
void print screen dimensions() 
i 


struct winsize whuf; 
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if ( ioctl ( 0, TIOCGWINSZ, &wbuf) !- -—1){ 
printf ("%d rows x *d colsin", wubuf.ws row, wbuf.ws col); 


printf ("Xd wide x &d tallin", wbuf. ws xpixel, wbuf.ws ypixel?; 


| 


fF TIOCGWINSZ 中 图 数 代码 ,wbuf 的 地 址 是 该 设备 控制 函数 的 参数 。 

阅读 头 文 件 是 了 解 设备 类 型 以 及 相关 函数 的 好 方法 。 联 机 帮助 中 有 关 没 备 的 内 容 也 也 
括 属 性 和 站 数 的 列表 。 例 如 ,Linux HE X st(4) 的 联机 帮助 讲述 了 使 用 ioctl 控制 SCSI gf 
带 驱 动 器 的 细节 。 


5.7 文件 . 设 竺 和 流 


任何 数据 的 狐 或 日 的 地 都 害 Unix 视 为 文件 。 基 本 的 系统 调用 既 适 用 于 磁盘 文件 也 同 
样 适 用 于 设备 义 件 ,它们 的 区 别 体 现 在 对 连接 的 操作 上 。 倍 极 文件 的 文件 描述 得 包含 对 缀 
冲 属 性 和 扩展 属性 的 定义 代码 。 终 端的 文件 措 述 符 包 含 编辑 .、 回 显 .字符 转换 和 其 他 操作 的 
ree X XR. 

可 以 把 每 个 处 理 步 豫 摘 述 成 连接 的 一 个 属性 ,但 是 反 过 来 说 ,连接 也 可 以 看 作 是 处 理 步 
又 的 组 合 。20 世纪 80 年 代 由 AT&T 开发 的 一 个 Unix 版 本 System V 建立 了 一 个 以 处 理 序 
JIA MBER. RA ARE. BI PBK. RR KITE 
BK. F--# JR EKER RAI BMRA, eA RES TI RE LIT LE 
Ae ACM eee. AX RISO RATS AGET GEN. 

当然 ,每 个 步骤 部 是 汽车 清洗 者 从 汽车 清洗 公司 美 来 部 件 完成 的 。 买 来 之 后 把 它们 安 
置 在 清洗 序列 中 的 某 个 位 置 ,整个 系统 就 可 以 工作 了 。 而 且 , 可 以 进行 重组 和 改造 ,比如 省 
略 某 些 特 定 的 步 观 (注意 请 不 要 用 热 蜡 !)， 

这 是 数据 流 模型 和 连接 属性 的 流 模 型 的 一 个 大 概 的 想法 。 流 模型 的 一 个 重要 特征 是 处 
理 的 模块 化 。 如 果 不 满 意 仅 能 支持 像 大 小 写 转 搞 这 样 的 终端 驱动 程序 ,可 以 设计 并 安装 一 
个 可 将 数字 转换 成 罗马 数字 的 模块 。 也 就 是 ,可 以 编写 一 个 能 完成 从 阿拉 伯 数 字 到 罗马 数 
字 转 换 的 处 理 模块 。 将 它 写 到 流 模型 规范 ,然后 使 用 特殊 的 系统 调用 将 该 模块 安装 到 系统 
上 。 流 数据 经 过 它 的 处 理 就 从 阿拉 伯 数 字 变 成 罗马 数字 了 ，。 

在 联机 帮助 上 查看 streamio 以 了 解 更 多 关于 通过 这 种 方式 管理 连接 属性 问题 的 解决 方 
案 。 在 某 些 版 本 的 Unix 中 , 流 用 来 实现 网络 服务 。 


小 结 


1 主要 内 容 

。 内 校 在 进程 和 外 部 此 界 间 交换 数据 。 外 部 志 界 包括 磁盘 文件 ,终端 和 外 部 设备 ( 像 打 
FN SL .磁带 驱动 韦 . 声 卡 和 鼠标 )。 到 磁盘 文件 和 终端 的 连接 有 相似 之 处 但 也 有 差异 . 

* 和 琵 盘 文件 和 设备 文件 都 有 名 字 、 属 性 和 权限 位 。 标 痊 文 件 系 统 调 用 open, read, 
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write close 和 [seek 可 被 用 于 任何 文件 或 设备 。 文 件 权限 位 以 同样 的 方式 应 用 于 您 
制 贡 备 文 件 和 磁盘 文件 的 访问 。 
到 磁盘 文件 的 连接 在 处 理 和 传输 数据 方面 不 同 于 到 设备 文件 的 连接 。 内 核 中 管理 与 
设备 连接 的 代码 被 称 为 设备 驱动 程序 。 通 过 使 用 fend ioci ,进程 可 以 该 取 和 改变 
设备 号 动 程序 的 设置 ， 

。 到 终端 的 连接 是 如 此 的 重要 UU RS BRE icgecattr 和 tesetattr 专门 用 来 提供 对 终端 驱 

动 器 的 控制 ， 

© Unix 命令 stty 使 得 用 户 能 够 访问 rcgetatrr 和 tcsetatir AA, 

2. BF 

进程 使 用 write 将 数据 写 人 文件 描述 符 , 用 rend 从 文件 描述 符 读 出 数据 。 文 件 描述 符 可 
被 连接 到 磁盘 文件 .终端 和 外 部 设备 。 文 件 描述 符 指 向 役 备 阮 动 程序 时 ,设备 驱动 程序 具有 
属性 设置 .如 图 5.13 所 示 ， 





FENE Sm 
OIT 






9.13. xf B SERE .连接 和 驱动 器 


3. 下 一 章 的 内 容 
从 磁盘 读 取 数据 相对 容易 ,但 是 从 用 户 终 端 诅 有 权 有 点 麻烦 ,因为 人 是 不 可 预知 的 。 需 要 
用 户 答 入 数据 的 程序 可 以 利用 终端 驱动 器 的 一 些 特别 的 连接 控制 功能 。 在 下 一 章 中 将 幸 细 
了 解 一 些 有 关 用 户 程序 编号 方面 的 主题 . 
4. 习题 
5.1 在 一 个 Linux 机 器 上 ,很 容易 读 取 鼠标 的 输出 。 做 这 个 工作 需要 处 于 文本 模式 。 
在 shell 中 .确保 称 为 gpm 的 程序 不 在 运行 : HA com - k, fia MA cat /dev/ 
mouse。 然 后 移动 鼠标 并 技 键 。 命 令 cat 从 设备 文件 中 读 取 数据 。 从 该 文件 读 取 
的 字 节 是 鼠标 产生 的 按键 次 数 和 移动 消息 。 


5.2 设备 文件 中 的 执行 位 是 什么 意思 ? 学习 命令 biff, 考 虑 这 个 位 的 作用 ， 


5.3 南面 已 经 讨论 了 没 备 文件 的 输 和 人 /输出 如 何 运作 。 那 么 像 In、mv 和 rm 等 的 目录 
操作 如 何 运作 呢 ? FAA 5. 1 ,解释 这 三 个 命令 是 如 何 影 响 目 录 .i- 节 点 和 驱动 程 
序 的 。 
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.+ 命令 rm 和 系统 调用 unlink 册 除 与 1- 节 点 的 一 个 链接 。 如 果 该 1i- 节 点 的 链接 数 
降 为 0, 则 内 核 释 放 磁 盘 块 和 i- 节点。 设备 i- 节 点 没有 分 配 列 表 和 数据 上 卖 。 取 而 
代 之 的 是 设备 文件 的 1- 节 点 包含 指向 内 核 设 备 驱 动 子 程序 的 指针 。 如 果 删 除 设 
SHCA WARE i 节点 ,驱动 程序 仍旧 在 内 核 中 。 如 何 新 创建 一 个 文件 
连接 到 该 设备 呢 ? GER: 阅读 mknod) 


.5 考虑 为 文件 添加 内 容 时 的 竞争 情况 。 前 文中 的 讨论 描述 了 一 个 可 能 的 顺序。 这 
两 个 进程 每 个 进程 有 两 个 操作 ,那么 有 和 多少 种 顺序 组 合 的 可 能 性 呢 ? 每 种 顺序 的 
结果 是 什么 ? 


.6 查看 Linux 内 核 代 码 , 找 出 D_APPEND 位 是 在 何 处 被 校 验 的 。 自 动 定位 是 如 何 
实现 的 ? 


,7 系统 调用 rename 是 个 原子 换 作 。 在 这 个 单一 的 调用 中 合并 了 哪些 步骤 呢 ” 查看 
Unix 的 内 核 代 码 , 以 了 解 所 有 的 竞争 情况 和 内 核 处 理 的 可 能 冲突 ，。Linux 代码 中 
Bf RES sve RU SE. 


.8 MEERN fopen 支持 以 添加 模式 打开 文件 。 例 如 ,fopen《"data"，"a")。 在 你 
的 系统 上 ,这 是 通过 添加 模式 开启 0_APPEND, 还 是 公公 在 打开 文件 后 定位 文件 
的 末尾 来 实现 的 呢 ? 找到 fopen 的 源 代 码 , 或 者 编写 一 个 程序 添加 模式 两 次 打开 
I] —^- 3c £F ,然后 交替 回 两 个 流 写 数据 。 根 据 所 发 生 的 现象 能 得 到 什么 结论 ? 


.9 例 程 eehostate.c 报告 文件 描述 符 0 表示 的 驱动 器 回 显 位 的 状态 ， 使 用 重 定向 符 
“C "将 标准 输 人 和 定向 到 其 他 的 文件 或 设备 。 尝 试 以 下 试验 : 

echostate < /dev/tty 

echostate < /dev/lp 

echostate < /etc/passwd 


echostate < 'tty' 


说 出 每 个 命令 行 的 输出 。 


.10 程序 setecho 改变 附加 在 标准 输入 的 驱动 程序 的 回 显 位 。 如 果 将 标准 输 人 重 定 

问 到 一 个 不 局 的 终端 ,就 可 以 改变 该 终端 的 回 显 位 。 

尝试 以 下 试验 。 

(12 在 同一 台 机 器 上 登录 2 次 (或 在 机 器 土 打 开 2 个 窗口 )。 

(2) 在 每 个 窗口 中 输 人 tty, 以 找到 那 两 个 窗口 的 设备 文件 名 。 假 设 一 个 连接 到 7 
dev/ttyp1,53 — 4 X f£ 8l|/dev/ttyp2., 

(3) 在 ttypl, 输 入 setecho n < /dev/ttyp2. 

OD Æ ttyp2 窗口 , 输 人 命令 echostate， 

(5) 然后 在 ttypl ,输入 echostate < /dev/ttyp2, 

(6) 解释 发 生 的 情况 。 

(7) 用 命令 suy 做 网 样 的 试验 。 
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可 能 有 -- 天 ,你 会 发 现 这 个 功能 的 确 很 有 用 。 


前 文中 的 例子 为 tcgetattr 和 tcsetattr 调用 使 用 的 文 任 描述 符 的 值 为 0。 第 一 个 
参数 是 文件 描述 符 ,也 可 以 是 任何 指向 到 终端 设备 连接 的 便 。 

文件 措 述 符 1 指向 标准 和 输出。 修改 echostate 和 setecho ,使 用 文件 描述 符 1 LA 
0。 这 个 变化 如 何 影响 程序 的 执行 ? 通常 标准 输入 和 标准 输出 指向 终 靖 。 解 释 
echostate 7» echostate. log 将 发 牛人 秆 么 ?使 用 文件 描述 符 0 BIT a Bf abe? 


如 果 想 建立 -个 接收 ppp 连接 的 系统 ,需要 安装 一 个 调制 解 调 右 , 并 且 配 园 串 行 
端口 。 串 行 接 上 1 的 终端 驱动 程序 应 该 被 配置 成 能 和 调制 解 调 器 协同 工作 。 陪 旋 
x /ete/gettydefs HM /ete/inittab, 5 27. Unix 如 何 为 在 品行 线 上 的 登录 定义 终 
Nu BE. 


A Unix 支持 三 种 版 本 的 O_SYNC; RAER Ai d Gd WmSSE. ASA 
需要 确保 以 其 种 方式 写 人 ?控制 这 3 种 类 型 的 标志 的 各 各 是 什么 ? 


在 一 个 终端 特殊 文件 上 的 读 和 写 的 权限 位 用 来 控制 什么 ? 使 用 tty 确定 你 的 终 
端的 名 字 ,然后 使 用 chmod 000 /dev/yourtty 将 你 的 终端 设置 成 对 你 来 说 也 不 可 
读 。 此 时 发 生 了 什么 情况 ”为 什么 呢 ? 


查看 你 系统 上 的 /dev 目录 ,找到 不 支持 read 操作 的 文件 ,不 支持 write 操作 的 文 
忻 以 及 不 支持 lseek 操作 的 文件 。 


在 /dev 中 使 用 1s -1 找到 各 种 设备 的 最 大 数目 和 最 小 数目 。 你 看 到 了 什么 模式 ? 
什么 设备 具有 同样 的 最 大 数目 ?这 些 设备 有 伸 么 共同 点 ”它们 如 何 区 分 ? 


为 tty 驱动 器 设置 的 4 个 组 命名 。 解 释 每 个 组 的 月 的 ,并 在 每 个 组 中 仑 名 两 
个 位 。 


程序 使 用 tcsetattr 关闭 当前 终端 的 问 显 模式 。 当 那个 程序 存在 , 终 问 处 于 无 回 
ARGS. A “方面, 当 程序 打开 一 个 文件 并 使 用 fcntl 将 描述 符 置 于 O_APPEND 
模式 ,下 一 个 打开 这 个 文件 的 程序 不 能 获得 自动 添加 模式 。 解 释 这 个 明显 的 不 
一 伊 的 地 方 。 


到 终端 的 连接 是 个 正规 的 文件 描述 符 。 你 能 够 使 用 fentl 为 与 文件 描述 竺 的 连接 
设置 O_APPEND jg iE? 自动 添加 对 设备 来 说 是 什么 意思 ? 
ioctl 和 fenil Ja BS EX Bil d TA ? 


Hak /dev (uà X E /dev/null 和 /dev/zero。 这 些 交 件 并 不 是 到 设备 的 连接 ,但 十 
它们 也 并 不 代表 做 盘 文 件 。 这 些 文件 是 用 来 做 什么 的 ? 为 什么 它们 是 有 有 出 的 ? 
Tr GE SE TE/dev 月 录 中 找到 虚拟 设 符 的 其 他 文件 吗 ,就 像 这 两 个 文件 … 样 ? 


第 5 章 ”连接 控制 :! 学 习 stty « lol * 


rc 








———- M 





o. Hy 42 2 J 
5.22 改进 这 章 中 write 的 简单 版 本 。 前 文中 的 版 本 要 求 用 户 输 和 人 设备 文件 名 ,而 有 日 该 
版 本 并 不 显示 不 同 的 欢迎 用 语 。 编 当 一 个 新 版 本 ,能 够 接受 用 户 名 作为 参数 ,上 
在 屏幕 上 显示 你 想 通信 的 用 户 。 查 看 write 的 标准 版 本 显示 的 内 容 。 
你 的 程序 应 该 可 以 处 理 这 样 的 特殊 情况 : 你 想 聊 大 的 人 可 能 没有 登录 。 为 - 方 
面 .你 想 著 天 的 人 可 能 登录 了 若 十 个 终端 。 


5.23 ”不想 被 那些 发 送 write 的 人 打扰 的 用 户 可 以 使 用 命令 mesg. DE mesg, Hiiti 
序 试 验 以 了 解 它 如 柯 工作 ,然后 写 一 个 这 样 的 程序 。 


5.24 通常 的 竞争 情况 包括 两 个 进程 同时 更 新 同一 个 文件 。 例 如 , 当 你 在 一 些 系统 上 
修改 你 的 密码 ,程序 passwd 重 写 文件 /etc/passwd。 如 果 两 个 用 户 同时 修改 他 们 
HERATI? 

一 种 防止 对 一 个 文件 进行 同时 访问 的 方法 是 利用 系统 调用 link 的 一 个 重要 性 
质 。 考 虑 以 下 代码 ，; 
* tries to make a link called /etc/passwd. LEK 
| x returns 0 if ok, 1 if already locked, 2 if other problem 
int lock, passwdt) 
int rv = 0; . /* default return value x/ 
if ( link ("/etc/passwd", "/etc/passwd.LCK") == - 1) 
rv = ( errno == EEXISTS ? 1 :2 5; 
return rv: 
} 
(1) 如 果 两 个 进程 在 同一 时 刻 执行 这 段 代 码 , 只 有 一 个 会 成 功 。 系统 调 用 link 如 
何 使 用 有 效 的 方法 给 文件 上 锁 ” 
(2) 使 用 这 种 方法 编写 一 个 程序 ,将 文本 的 一 行 添加 到 一 个 文件 ， 你 的 程序 需要 
尝试 建立 链接 。 如 果 链 接 成 功 ,程序 能 够 打开 文件 ,添加 行 , 人 然后 删除 链接 ， 
如 果 建 立 链接 失败 ,你 的 程序 需要 使 用 sleep CD Se fF 1 s, 然 后 由 次 尝试 。 你 
需要 确保 你 的 程序 不 会 永 近 处 于 等 竺 状态 。 
(3) 写 - 一 个 不 用 lock_passwd 的 unlock passwd AR., 
(4) 本 例 显 水 了 人 允许 进程 给 一 个 已 存在 的 文件 上 锁 , 但 是 如 何 使 用 link 编程 避免 
两 个 进程 创建 同样 的 文件 呢 ? 
(5) at vipw, vipw Ay Bi fit f] e sels? 


5. 29. Bip c-r I E id as d RTT SEE ARE Eg. MER CHE EC BEIPUREE SE EE CX 
fF] KEFR BEER ER. SU BR SUBE Lt) FP Sek ab T ef 
Ra. MREFA W ,在 蕊 释放 锁 之 前 崩溃 ,或 被 用 户 按 下 Ctrl-C 结束 ,将 会 
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一 种 解决 方法 是 捧 有 锁 的 程序 每 陋 ” 秒 修 改 文件 。 程 序 可 以 使 用 ime KK. 
等 待 锁 的 程序 可 查看 修改 时 间 , 检 查 锁 是 否 依 然 有 效 ， 如 果 锁 在 上 述 规 证 的 疝 
帮 中 未 被 修改 ,那么 其 他 的 程序 可 随意 删除 链接 ,然后 再 次 创建 链接 。 

编写 一 个 lock passwd 的 新 版 本 ,使 之 带 有 表示 秒 数 的 数字 参数 。 这 个 新 版 本 能 
够 实现 上 面 所 描述 的 逻辑 。 


MRKAR anar? 编写 一 个 程序 ,用 来 将 一 个 大 的 磁盘 文件 分 装 
在 小 的 片 里 面 ,例如 2MB 的 文件 被 分 装 在 16 字 节 的 片 的 集合 中 。 将 O0. SYNC 
开局 和 关闭 进行 试验 。 改 变 文 件 和 分 片 的 大 小 ,以 查看 它们 如 何 影响 结果 。 


前 文 包含 了 关闭 文件 描述 符 磁 盘 缓 冲 的 代码 。 编 号 一 个 将 缓冲 重新 开启 的 程序 。 


编写 一 个 称 为 uppercase. e 的 程序 ,用 来 跟踪 终端 驱动 器 里 的 OLCUC 位 ,并 报告 
该 位 的 当前 状态 ， 


stty ~a 的 输出 包含 终端 窗口 的 行 数 和 列 数 。 这 些 值 不 是 来 自 tcgetattr, 而 是 来 
E icctl。 使 用 这 个 系统 调用 修改 弟 1 章 的 more:, 使 它 能 够 使 用 终端 窗口 的 大 小 
显示 ,而 不 是 固定 值 24， 


6. MEA 
基于 本 章 的 内 容 , 能 够 了 解 和 编写 以 下 这 些 Unix 程序 : 
write,stty passwd wall biff .mt 磁带 控制 程序 ,可 能 你 的 系统 上 没有 }) 
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概念 与 技巧 

。 软件 工具 与 用 亡 程 序 

* 读 取 和 修改 终端 驱动 程序 的 设置 

， 终端 驱动 程序 的 模式 

*« 3EER SEH A 

。 用 户 输入 的 超时 

。 对 信和 号 的 介绍 : Cult C EM LER 
相关 的 系统 调用 

e fentl 


« signal 


6.1 软件 工具 与 针对 特定 设备 编写 的 程序 


在 Unix 系统 ,虽然 设备 看 起 来 很 像 磁 盘 文 件 , 和 但 是 设备 是 不 同 于 磁盘 文件 的 。 在 第 5 
章 中 已 经 看 到 ,得 序 能 对 设备 执行 open.close, read, write 和 lseck 操作 ,但 是 也 已 经 看 到 设 
备 有 相应 的 驱动 程序 ,那些 驱动 程序 包含 许多 与 设备 相关 的 控制 和 属性 。 程 序 如 何 认 识 这 
BR S PE? 

1， 软 件 工具 ; 从 stdin & THEA, BH stdout 

对 磁盘 文件 和 设备 文件 不 如 以 区 分 的 程序 被 称 为 软件 工具 。Unix 系统 有 好 几 百 个 软件 
工具 ,包括 who.ls.sort,uniq.grep.tr 和 du。 软件 工具 使 用 图 6.1 所 示 的 模型 。 

软件 工具 从 标准 输入 读 取 字 节 ,进行 一 些 处 理 , 然 后 将 包含 结果 的 字 节 流 写 到 标准 输 
出 。 工 具 发 送 错 误 消息 到 标准 错误 输出 ,它们 也 被 当 司 简单 的 字 节 流 来 处 理 。 这 些 文件 措 
述 符 能 够 连接 到 文件 .终端 .鼠标 .光电 管 ,打印 机 和 管乐器 ; 工 其 对 所 处 理 的 数据 的 源 和 目 
的 地 不 做 任何 很 设 。 其 他 很 多 程序 也 能 从 请 令 行 所 指定 的 文件 中 读 取 数据 。 
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SE. 大 多 数 进 程 
自动 将 前 3 个 文件 
Rah CET IF. v] 
不 需要 调用 openi) 
来 建立 连接 





图 6.] 3 种 标准 文件 描述 符 
这 些 程序 的 输 人 和 箱 出 能 够 诈 重 定向 到 任何 类 型 的 连接 上 : 


S sort > outputfile 
5 sort x > /dev/lp 
S who] tr '[a- z]' ‘[A-2Z]' 


2. 特定 设备 程序 : 为 特定 应 用 控制 设备 

其 它 程 序 ( 如 控制 扫描 仪 .记录 压缩 盘 、 操 作 磁 上 可 驱动 程序 和 拍摄 数码 相片 的 程序 ) 也 能 
同 特定 设备 进行 交互 。 在 本 章 中 将 通过 了 仙 最 常见 的 与 特定 设备 相关 的 程序 (通过 终端 与 
人 交互 的 程序 ) 来 探讨 在 写 这 些 程序 时 用 到 的 概念 和 技术 、 将 这 些 面 向 终端 的 程序 称 为 用 
PEIT. 

3， 用 户 程序 ， 一 种 常见 的 设备 相关 程序 

用 户 程 序 的 例子 有 vi.emacs pine, more, lynx, hangman, robots 和 许多 加 利 褐 尼 亚 大 学 
伯克利 分 校 编 写 的 游戏 程序 吃 。 这 些 程 序 设置 终端 驱动 程序 的 击 键 和 输出 处 理 方式 。 驱 动 
程序 有 很 和 多 设置 ,但 是 用 户 程 序 常 用 到 的 有 : 

C1) 立即 响应 击 键 事件 

(2) 有 限 的 输入 集 

(3) 输入 的 超时 

(4) BERE Ctrl-C 

下 面 将 通过 编写 一 个 实现 所 有 这 些 特点 的 程序 来 学 习 这 些 主题 ， 


6.2 终 疹 张 动 程序 的 模式 


首先 讨论 在 前 面 章 节 中 提 到 的 终端 驱动 程序 。 下 面 通过 一 个 简短 的 转换 程序 来 深入 理 
解 设备 驱动 程序 的 细节 ”; 


吕 ” 这 些 程 序 的 源 代码 可 以 在 网 上 找到 , 导 找 bsdgames 
Q 可 以 用 tr 命令 做 同样 的 事情 ,但 是 tr 的 GNU ARM ARM RAPE KW ERAS RRL AYT. 
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/x rotate.c : mapa—>b, b—»c, -. z —a 
+ purpose:useful For showing tty modes 
"/ 


# include « stdio. h> 
8 include <ctype. h> 


int main() 
{ 
inr c; 
while ( ( c= getchar() ) {= EOF )( 
lf (e == 'z') 
ES gs 


else if (islewer(c)) 
c++ P 


putchar(c) ; 


6.2.1 规范 模式 : 缓冲 和 编辑 
使 用 默认 设置 运行 这 个 程序 (<- RRB). 


S cc rotate.c - o rotate 
$ ./rotate 

abx« - cd . 

bcde 

efgCtri - C 

$ 


图 6.2 显示 了 终端 .内 核 、rotate 程序 和 和 数据 流 。 





Rotale EF 


图 6.2 输入 的 内 容 和 程序 所 得 到 的 内 容 


上 述 的 实验 揭示 了 标准 输入 处 理 的 如 下 特征 : 


en 
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(1) Fc ss AJ xT ax dM uil RS AAT E: 

(2) 击 键 的 同时 字符 显示 在 屏 算 上 ,但 是 直到 按 了 回 车 键 GEH OE UE SUA : 

(3) Ctrl-C E Sig $8 A JEZR IL. 

程序 rotate 不 做 这 些 换 作 。 绥 冲 . 回 显 .编辑 和 控制 键 处 理 孝 由 驱动 程序 完成 。 图 6.3 
WR T AEF PRF. 


fiA tE: 






输入 编 加 
Kov RER "N n” 
控制 字符 处 再 


图 6.3 £53] OR h p Mb XB JR 


缓冲 和 编辑 包含 规范 处 理 (canonical processing), 24 ix ife e GE gr 29 ZR ue EBEN 
Ub ALTO RA. 


6.2.2 非 规范 处 理 
IE Ex ote ABE abx«- cd, 然后 ,输入 efg Ctrl-C), 


$ stty - icanon; . /rotate 
abbcxy*? cdde 
effqgh 


S stty icanon 


an stty ~icanon 关闭 了 驱动 程序 中 的 规范 模式 处 理 。 上 例 并 设 有 展示 非 规范 模式 的 
各 个 侧 曾 .而 只 是 演示 了 输入 处 理 方式 被 改变 了 ， 

特别 地 , 非 规范 竺 式 没 有 缓冲 。 输入 字母 “a”, 驱动 程序 跳 过 缓冲 层 , 将 字符 直接 送 到 程 
FF rotate, 然 后 程序 显示 字符 “b”。 用 户 输入 未 被 缓冲 可 能 是 一 件 麻烦 事 . 24 Hl P d IRI NI Be 
TFF ES PF AR RE BE fo] Ss 字符 早 就 送 给 程序 了 ， 

也 后 一 个 试验 :尝试 以 下 命令 ,然后 稍 砍 输入 “abx<-- cd 和 cfg" Cir] - C. 

$ stty - icanon - echo ; . /rotate 

bcy^^? de 

Fgh 

S stty icanon echo (注意 ; 你 看 不 到 这 个 。 为 什么 ?) 


佳 这 个 例子 中 关于 了 规范 模式 和 回 显 贷 式 。 浇 动 程序 不 再 显示 所 答 和 人 的 字符 。 答 出 


一 
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el 





仅 来 自 程 序 。 当 退出 这 个 程序 时 ,了 驱动 程序 仍旧 处 于 无 回 显 . 非 规范 模式 中 ,并 且 一 直 处 
FAS MARA BSB AE TRB. shell 打印 一 个 显示 符 , 等 竺 下 一行 命令 。 有 些 shell & 
置 驱动 程序 ,而 有 些 不 这 么 做 。 如 果 shell 并 不 重 置 驱动 程序 ,将 继续 处 于 无 回 显 、. 非 规范 
的 模式 中 ， 


6.2.3 终端 模式 小 结 


如 果 还 未 在 终端 尝试 这 些 例子 .现在 就 做 。 这些 例 子 演示 了 终端 驰 动 程序 的 不 同 模式 。 
当 为 Unix 设计 用 户 程 序 时 ,需要 决定 哪 种 终端 模式 适合 这 个 应 用 。 

l. 规范 模式 

规范 模式 .也 被 称 为 cooked 模式 .是 用 户 常见 的 模式 。 了 驱动 程序 输入 的 字符 保存 在 缓 中 
区 ,并且 仅 在 接收 到 回 车 键 吕 时 才 将 这 些 缓冲 的 字符 发 送 到 程序 .缓冲 数据 使 驱动 程序 可 以 
实现 最 基本 的 编辑 功能 ,如 删除 字符 .单词 或 整 行 。 当 用 户 分 别 技 下 删除 键 . 单 闻 删除 键 或 
是 终止 键 时 ,这 些 功 能 就 会 被 里 用 。 第 指派 到 这 些 功 能 的 特定 键 在 驱动 程序 里 设置 ,可 通过 
命令 suv 或 系统 沽 用 tcsetattr XER. 

2. AR AR IC HK 

当 缓 冲 和 编辑 功能 被 关闭 时 ,连接 被 称 为 处 于 非 规范 模式 。 终 端 处 理 器 仍旧 进行 特定 
的 字符 处 理 , 例 如 ,处 理 Ctrl-C 及 换行 符 和 回 车 符 之 间 的 转换 。 但 是 ,用 于 删除 .单词 删除 
和 妈 止 的 编辑 键 没有 特殊 的 意义 ,因此 相应 的 输入 被 视 作 常规 的 数据 输入 。 

如 果 用 非 规 范 模 式 编写 程序 ,并 且 第 望 用户 能 够 编辑 他 们 的 输入 ,和 需要 在 你 的 程序 中 实 
项 编 辑 功 能 。 

3. raw 模式 

每 个 处 理 步 又 都 被 一 个 独立 的 位 控制 。 例 如 ,1SIG 位 控制 Cul-C Sé 15 BT £1F—^ 
HF. 程序 可 随 闪 关闭 所 有 这 些 处 理 步 枝 。 

当 所 有 处 理 都 被 关闭 后 ,驱动 程序 将 
输入 直接 传递 给 程序 。 在 这 种 情况 下 , 豫 
Oh EE FE BR BR WAL raw 模式 。 在 终端 驱动 
程序 更 为 简单 的 老 版 本 系统 中 ,有 个 特定 
4g PIE PK AT raw 模式 。 命令 suy XA 
raw 模式 ,将 它 作 为 命令 行 的 一 个 选项 。 联 
机 帮助 上 有 关 suy 的 部 分 解释 了 raw 模式 
的 含义 。 

终端 张 动 程序 是 内 核 中 一 些 复 杂 的 程 
序 。 通 过 前 面 的 学 习 和 试验 可 以 更 为 清楚 
地 了 解 它 们 的 各 个 组 成 部 分 各 功能。 图 6.4 图 6.4 终 喘 驱动 程序 的 主要 组 成 部 分 
显示 了 其 主要 部 分 。 





O 或 者 是 当前 定义 的 EOF 键 .通常 为 Ctrl-D。 
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各 种 模式 都 有 各 自 特 定 的 用 旗 。 为 了 帮助 理解 这 些 模 式 的 实际 应 用 价值 ,下 面 开 发 了 
一 个 使 用 不 同 模式 的 用 户 程序 ， 


6.3 编写 一 个 用 户 程序 : play again, c 


很 多 用 户 应 生 程序 ,例如 ,自动 到 款 机 各 计算 机 洲 烧 , 巍 会 向 用 户 提 出 yes/no 的 问题 。 
以 下 程序 脚本 是 一 个 银行 应 用 程序 的 主 往 环 ， 


4' /bin/sh 
i 
i atm.sh - a wrapper for two programs 
+ "T 
while true 
do 
do a transaction H run a program 
if play again # run our program 
then 
continue i ify" loop back 
fi 
break # if "n" break 
done 


就 像 其 他 上 典型 的 Unix 风格 的 程序 ,这 个 银行 脚本 程序 将 程序 的 各 个 组 件 组 合 起 来 。 第 一 
个 组 件 是 一 个 称 为 do a transaction | 的 程序 ,完成 ATM 的 丁 作 。 第 二 个 组 件 play. again. M RJ P! 
那儿 得 到 “是 ”或 “ 否 * 的 回答 。 下 面 实现 第 二 个 组 件 程 序 。 这 样 的 组 件 架 构 允 许 方便 地 更 换 不 
问 版 本 的 play. again. 

play. again. c 的 思 辑 很 简单 ， 

。 对 用 户 显示 提示 问题 

© 接受 输入 

© IARE y^ ,返回 O 

© URE” nas BET 

1. fj: play againO.c 





完成 上 述 功 能 


/* play againQ.c 

* purpose: ask if user wants another transaction 
* method: ask a question, wait for yes/no answer 
x returns; ü-7-yes, 1 —-no 
* better: eliminate need to press return 
xf 

# include «< stdio, ho 


Bm include < termicos. hi> 


# define QUESTION "Do you want another transaction" 
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int get response( char * ); 


int maint} 
int response; 
response = get response(QUESTION); /x get some answer */ 
return response; 
| 
int get. response(char * question) 
/x* 
* purpose: ask a question and wait for a y/n answer 
* method: use getchar and ignore non y/n answers 
* returns; 0 —- yes, 1 =>no 
xf 
| 
printf(" & s (y/n)7", question; 
while(1){ 
switch( getchar() )| 
case 'y?: 
case 'Y': return 0; 
case 'n': 
case 'N*': 


case EOF: return 1; 


| 


这 个 程序 显示 提示 问题 ,然后 循环 该 取 用 户 的 输入 ,直到 用 户 输入 了 y” n” YR 
“N" 才 停止 。play_again0 有 两 个 问题 ,这 两 个 问题 都 由 运行 时 处 在 规范 模式 引起 。 首 先 , 用 
户 必 须 按 回 车 键 ,play_again0 才能 接受 到 数据 。 第 二 , 当 用 户 按 回 车 键 时 ,程序 接收 整 行 的 
数据 并 对 其 进行 处 理 。 因 此 ,play_again0 把 下 面 的 输入 作为 一 个 否定 的 回答 ， 


$ play again 
Do you want another transaction (y/n) ? sure thing! 


56 — T Pod E PAAR A, OTE RE OE TER P dit i9 Fa nf (39 s AL NF. 
即时 响应 





2. 例子: play againl.c 


/* play againl.c 
x purpose: ask if user wants another transaction 
x method: set tty into char - by - char mode, read char, return result 
* returns: ( 27-yes, 1 =>>no 
* better: do no echo inappropriate input 
x 


4 include <stdio.h> 
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4 include  -—termios.h 7 
# define QUESTION "Do you want another transaction" 


maint } 


| 


int response; 


tty mode(0); /* save tty mode */ 

set crmode(); /* set chr ~ by- chr mode «/ 
response = get response( QUESTION) ; /* get some answer */ 

tty mode(1); /* restore tty mode «/ 


return response; 
int get response(char * question) 
ix 
x purpose. ask a question and wait for a y/n answer 
x method: use getchar and complain about non y/n answers 
* returns; 0 => yes, 1 no 
x / 
| 


int input; 


printf(" * s (y/n)?", question); 


while(cl)! 
switch( input = getchar() }{ 
case 'y’: 


case 'Y': return OQ: 
case 'n': 
Case ‘Nt, 
case EOF. return 1; 
default: 
printf(" \ncannot understand *c, ", input); 


printf( "Please type y or no Xn"? ; 


\ 
| 


set crmode() 
/* 
* purpose: put file descriptor 0 (i.e. stdin) into chr - by - chr mode 
x method: use bits in termios 
x/ 
{ 
struct Lermios ttystate; 
tcgetattr( Ô, &ttystate); /* read curr, setting «/ 
ttystate.c lfiag &= ~ICANON: /* no buffering */ 
ttystate. c_ce] VMIN | = 1; /* get 1 char at a time »/ 
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trsetattr( 0 , TCSANOW, &ttystate) - /* install settings *; 


l 
x hod == 0 => gave current mode, how == 1 => restore modc « 
Lty mode( int how) 
i 
static struct termios original mode; 
if ( how == 03 
tcgetattr(0, &original mode); 
else 
return tcsetattr(0, TCSANOW, &original mode); 


i 


play againl 首先 将 终端 兽 于 一 个 字符 接着 一 个 字符 的 模式 (eharacter 7 by ~ character 
mode) ,然后 调用 喇 数 显示 一 个 提示 符 , 并 获得 一 个 响应 ;最 后 设置 终端 为 原始 的 模式 。 注 
意 , 最 后 并 未 将 终端 置 于 规范 模式 。 取 而 代 之 的 是 ,将 原先 的 设置 复制 到 一 个 称 为 original_ 
mode 的 结构 中 ,结束 时 恢复 这 些 设置 。 

将 终端 置 于 字符 输入 模式 包括 两 部 分 工作 。 除 了 将 CANON 位 关闭 外 ,还 要 将 值 1 分 
配给 控制 字符 数组 中 以 VMIN 为 下 标的 元 素 。VMIN 的 值 告 沂 驱 动 程序 一 次 可 以 读 取 多 少 
个 字符 。 因 为 希望 一 个 接 一 个 地 读 取 字符 ,所 以 将 这 个 值 置 为 1, 如果 和 希望 一 次 读 取 3 ITE 
符 了 , 则 可 和 将 值 置 为 3。 

编译 并 运行 这 个 程序 ,输入 sure 作为 回答 : 


5 make play againl 

ce play againl.c - o play againl 

$ . /play,againi 

Do you want another transaction (y/n)? s 
cannot understand s, Please type y or no 
u 

cannot understand u, Please type y or no 
I 

cannot understand r, Please type y or no 
E 


cannot understand e, Please type y or no 


YS 

TEA ARRE. play againl 接收 和 处 理 宁 符 , 而 不 再 等 待 回 车 键 ， 但 是 对 每 个 非法 字符 
都 担 示 错误 信息 可 能 让 人 觉得 比较 和 类。 一 个 更 好 的 设计 是 关闭 回 显 模式 ,丢掉 厅 需 要 的 字 
符 , 直 到 得 到 可 接受 的 字符 为 止 。 


D Sa EEA PSHE. ERE RAL HERRE TP AA. AO cscape Ra -[-1-1~, Hx 
i AK escape SE FF (ASCII 27), EWI- -REA — A LAY 3 ha 4 个 字符 ， 
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3， 例 了 了;， play againZ. c-— 4 wi 3E Kat 


/* play againZ.c 


* purpose. ask if user wants another transaction 


x method: set tty into char — by — char mode and no — echo mode 


x read char, return result 

* returns: 0 = >Yes, 1 --no 

» better: timeout if user walks away 
x 

*/ 


z include <stdio.h> 


H include < termios. h> 


# define QUESTION "Do you want another transaction" 


maint } 
i 
int response; 
tty_mode(0); 
set cr noecho model); 
response = get response( QUESTION); 
tty modet1); 
return response; 
I 
int get_response(char x question) 


/* 


/* save mode */ 
/* set 一 icanon, - echo «/ 
/* get some answer */ 


/* restore tty state «/ 


* purpose. ask a question and wait for a y/n answer 


+ method; use getchar and ignore non y/n answers 


* returns: 0 => yes, 1 — no 


af 


printf("& s (y/n)?", question); 


whileCi)i 
switch( getchar() 2| 
case 'y'. 


case 'Y'. return 0; 
case 'n'- 
case 'H'. 


case EOF; return 1; 


1 
1 


set cr noecho mode(? 
fx 


* purpose; put file descriptor 0 into chr 一 


by — chr mode and noecho mode 
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x method: use bits in termios 
x/ 
{ 


struct termics ttystate: 


tegetattr( 0, &ttyetate) ; /* read curr. setting */ 
ttystate.c lflag  &- ~ ICANON; /* no buffering */ 
ttystate.c lflag &= ~ECHOQ; /* no echo either */ 
ttystate.c cel VMIN] -]1; /* get 1 char at a time */ 
tcsetattr( 4 , TCSANOW, &ttystate); /* install settings */ 

! 

/* how == 0 => save current mode, how == 1 => restore mode x/ 


tty mode(int how) 
i 


static struct termios original mode; 
if how == 0) 
tcgetattr(0, &original mode); 
else 
return tcsetattr(0, TCSANOW, &original mode); 


} 


这 个 程序 和 前 商 的 版 本 在 两 个 方面 有 所 不 同 。 设 置 终端 驱动 程序 的 函数 关闭 了 回 显 
(i. ER ,恢复 函数 不 需要 特意 将 该 位 开启 。 另 一 个 变化 是 画 数 get response 不 再 提示 错误 
信息 ,而 仅仅 是 忽略 它们 。 

编译 并 运行 这 个 程序 。 如果 输 入 sore, 没 有 显示 任何 内 容 。 仅 当 输 人 了 或 ma 时 ,程序 
返回 。 

play again2 姐 所 希望 的 那样 运行 ,但 是 它 还 有 待 改 进 。 如 果 这 个 程序 运行 在 真正 的 
ATM 上 ,而 顾客 在 输入 y 或 n 之 前 走 开 了 ,将 会 怎样 ? 下 一 个 顾客 跑 过 来 按 下 y. BRBEXEA 
那个 离开 的 顾客 的 账号 。 所 以 如 采用 户 程 序 包 含 超 时 特征 ,会 变 得 更 安全 ， 


SERA SERA: play again3. c 


下 一 个 程序 版 本 含有 超时 特征 。 通 过 设置 终端 驱动 程序 ;使 之 不 等 竺 输 人 来 实现 这 个 
特征 。 先 检查 看 是 否 有 输入 ,如 果 发 现 没有 输入 , 则 先 睡眠 几 秒 钟 ,然后 继续 检查 输入 。 如 
此 尝试 3 次 之 后 放弃 ， 

1 阻塞 与 非 阻塞 输入 

当 调 用 getchar 或 read 从 文件 描述 符 读 取 输 人 时 ,这 些 调用 通常 会 等 竺 输入， 在 play_ 
again 例子 中 ,对 getchar 的 调用 使 得 程序 一 直 等 竺 用 户 的 输入 ,直到 用 户 输 人 一 个 字符 。 程 
厅 被 阻 窒 , 直 到 能 获得 某 些 字符 或 是 检测 到 了 文件 的 末尾 。 那 么 如 何 关闭 输入 阻塞 呢 ? 

阻塞 不 仅仅 是 终端 连接 的 属 忻 ,而 是 任何 一 个 打开 的 文件 的 属性 。 程序 可 以 使 用 fenil 
或 open 为 文件 描述 符 启 动 非 阻塞 输 和 人 (Cnonblock input), play_again3 使 用 fent! Jg X ft Hk 


* 164 * Unix/Linux 编程 实践 教程 


述 符 开启 O NDELAY? 标志 。 

关闭 一 个 文人 竹 描 述 符 的 阻塞 状态 并 调用 read, FABRE? 如 果 能 够 获得 输入 ,read 
获得 输入 并 返回 所 获得 的 字符 个 数 。 如 上 果 没 有 输入 字符 ,read 返回 0, 这 就 像 明 到 义 件 末 民 
E. WR ASIA read 返回 一 1。 

非 阻 塞 操 作 的 内 部 实现 相当 简单 。 每 个 文件 都 有 一 块 保存 未 读 取 数 据 的 地 方 , 如 图 6.4 
所 未 的 驱动 程序 里 最 顶端 的 存储 方 专 。 如 果 文 件 措 述 符 置 了 O 〇 O_NDELAY 位 ,并 且 那 块 空间 
是 空 的 ;read 调用 返回 0。 如 果 能 阅读 与 O_NDELAY 有 关 的 的 Linux WAI. 3X n] EA T f 
到 实现 的 细节 。 

2. WF; play again3. c 





使 用 非 阻塞 模式 实现 超时 响应 


/* play again3.c 

* purpose: ask if user wants another transaction 

* méthod; set tty into chr ~ by chr, no- echo mode 

* set tty into no - delay mode 

* read char, return result 

* returns; 0= yes, 1 =>no, 2 —— timeout 

* better; reset terminal mode on Interrupt 

af 
include  «stdio. hl 

# include < termis. ho 
# include  —fcntl.h— 
# include «string, h> 


H define ASK "Do you want another transaction" 


Hdefine TRIES 3 /* max tries x/ 

H define  SLEEPTIME 2 /* time per try «/ 
d define BEEP putchar('\a') /* alert user »/ 
maint > 


1 


int response > 


tty_mode(Q) ; /* save current mode «/ 
set cr noecho mode(); /* set — icanon, — echo */ 
set nodelay mode(); /* noinput ==> EOF #/ 


response = get_response(ASK, TRIES); /x get some answer x/ 
tty_mode(1)} : /* restore orig mode " / 
return response: 

; 

get response( char +# question 

ix 


* purpose; ask a question and wait for a y/n answer or maxtries 


int maxtrics) 


F 


a a e 


To ETEA OLNONBLOCK fi, AA SUB Le 
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ad 


* method. use getchar and complain about non y/n input 
* returns; Ù => yes, 1 -7»no, 2 =>timeout 

x ^ 
| 


int input; 


printf("& s (y/n)?", question); /* ask «/ 
fflush(stdout); /* force output */ 
while ¢ 1 )| 
Sleep(SLEEPTIME); /x wait a bit x/ 
input - tolower(get ok char()); /* get next chr «/ 
if ( input == 'y*) 
return 0; 
if ( input == 'n' ) 
return i; 
if ( maxtries-- == 0) /* outatime? x/ 
return 2; /* Sayso «/ 
BEEP ; 


t 


| 


/* 
* skip over non- legal chars and return y,¥,n,W or EOF 


yf 


get ok char() 
i 
int c; 
while( ( c = getchar() ) !- EOF && strchr("yYnN",c) == NULL } 
return c; 
i 
set cr noecho mode() 
jx 
* purpose: put file descriptor 0 into chr- by —- chr mode and noecho mode 
* method: use bits in termios 
wj 
‘ 


struct termios ttystate; 


tcgetattr( 0, &ttystate); /* read curr. setting */ 
ttystate,c lflag = ~ [CANON; /* no buffering «/ 
ttystate.c lflag = ~ ECHO: /* no echo either x/ 
ttystate.c, cc| VMIN) - 1; /* get 1 char at a time xy 


tcsetattr( O , TCSANOW, &ttystate); 


/* install settings #/ 
I 

set nodelay mode() 

fx 
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* purpose: put file descriptor 0 into no— delay mode 
x method: use fentl to set bits 
* notes. tcsetattr() will do something similar, but it is complicated 
T 
| 


int termflags:. 


termflags - fcntl(0, F GETFL); /* read curr. settings */ 
termflags | = © NDELAY; /* flip on nodelay bit */ 
fcntl(0, F_SETFL, termflags); /* and install rem */ 

i 

/* how == 0 =>> save current mode, how == 1 => restore mode */ 


/* this version handles termios and fcntl flags */ 
tty mode(int how) 
1 
static struct termios original mode. 
static int original flags; 
if ( how == 0 ){ 
tegetattr(0, &original mode); 
original flags = fcntl(O, F_GETFL); 
} 


else | 
tesetattr(0, TCSANOW, &original mode); 
fontl( 0, F_SETFL, original flags); 


; 


程序 的 这 个 版 本 有 一 些 新 特点 。 首 先 使 用 fenu AMFA dE EE SER S. KKE get_ 
response 中 使 用 sleep 和 计数 器 maxtries。 

3. play again3 的 小 问题 

play again3 并 不 是 理想 的 。 运 行 在 非 阻 寒 模式 ,程序 在 调用 getchar 给 用 户 输 人 字符 之 
前 睡眠 25。 就 算 用 户 在 1s 内 完成 输入 ,程序 也 要 在 2s 后 才 得 到 字符 。 用户 可 能 会 感到 迷 
R: “FER BRA TIS? CARRERE? ERR FETT 

可 以 使 程序 更 快 地 做 出 响应 吗 ? 可 以 减少 每 次 调用 getchar 间 的 睡眠 时 间 , 并 相应 地 增 
加 循环 次 数 来 实现 相同 的 超时 设置 。 

另外 ,注意 在 显示 提示 符 之 后 对 {flush 的 调用 。 如 果 没 有 那 一 行 ,在 调用 getchar 之 前 ， 
提示 符 将 不 能 显示 。 究 其 原因 是 ,终端 张 动 程序 不 仅 一 行 行 地 缓冲 输入 ,而 且 还 一 行 行 地 绥 
冲 输出 。 驱 动 程序 缓冲 输出 ,直到 它 收 到 一 个 摘 行 符 或 者 程序 试图 从 终端 读 取 输入 。 在 这 
个 例子 中 ,为 了 给 用 户 读 提示 符 的 时 间 ,需要 延迟 读 和 人。 这 样 就 必须 调用 £flush. 

4. 实现 超时 的 其 他 方法 

Unix 提供 更 好 的 方法 来 实现 超时 功能 ,在 驱动 程序 中 设置 数组 e_ccL] 中 的 元 素 VTILME 
将 超时 功能 的 实现 移 芭 终端 驱动 程序 。 本 章 的 一 个 练习 提供 了 相关 细节 。 系 统 调 用 select 
包含 一 个 超时 参数 。 将 在 后 面 的 章节 中 讨论 select, 
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5. play again3 的 一 个 大 问题 
play again3 忽略 它 所 不 想 要 的 字母 ,识别 和 处 理 合 法 输入 ,并 在 规定 的 时 间 间 隔 内 无 全 
法 输入 的 情况 下 自动 退出 。 但 是 如 果 用 户 输 人 Ctrl-C 将 会 如 何 ? 下面 蚌 它 的 运行 情况 : 


5 make play again3 

cc play again3.c — o play again3 

S. /play again3 

Do you want another transaction {y/n}? press Ctrl - C now 
$ logout 

Connection to host closed. 

bashs 


当 按 下 Ctrl-C SL play_again, 不 但 终止 了 这 个 程序 ,同时 所 终止 了 整个 登录 会 
话 。 这 是 为 什么 呢 ? play_again3 dg 3 PAR: 初始 化 .获得 用 户 输 人 和 恢复 设置 ,如 在 图 6. 5 
中 描述 的 那样 。 
| 设置 O NDELAY 
初始 控制 流 | 设置 crmode 


显示 提示 符 当 读 取 终 止 时 的 流向 
| SAP RA 
PDC PNE —»- HR RE 





SIGINT 
恢复 try 设置 
进程 正常 退出 时 的 流向 一 | 恢复 fent 标志 
退出 
JEREIE 3658 H 
图 6.5 Ctrl- C & I 3E 3E 8E oT c9 os 


初始 化 部 分 将 终端 置 于 非 阻 塞 答 和 人 状态。 程序 随后 进入 主 循环 并 打印 提示 ,睡眠 和 读 


取 输 入 。 然 后 在 程序 运行 中 通过 按 Ctrl-C 键 来 终 目 程序。 那么 终端 驱动 程序 处 于 什么 
状态 ? 


实际 上 程序 会 立刻 退出 ,而 不 执行 重 轻 驱动 程序 的 代码 。 当 返 问 shell 显示 提示 符 并 从 
用 户 处 获得 命令 行 时 ,终端 份 旧 处 于 非 阻塞 模式 。shell 调用 read 获取 命令 行 ,但 是 因为 处 
于 非 阻塞 状态 ;read 立即 返回 0。 总 之 ,程序 结束 时 文件 措 述 符 处 于 一 个 错误 的 状态 。 下 一 
4" Bs f 5€ 23 uU fnp SE A SE Ctrl-C BMAF. 

6， 为 什么 有 些 情 况 下 不 会 被 注销 ? 

很 多 Unix shell 包含 编辑 特征 ,如 使 用 箭头 键 在 执行 过 的 命令 列表 中 滚动 。 这 些 shell 
运行 在 实现 这 些 功能 所 需要 的 raw 模式 下 。 当 程序 退出 或 死亡 时 , 像 bash 和 tesh 这 些 shell 
立即 重 轩 终端 的 属性 。 
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6.4 信 号 


Ctrl-C 中 断 当 前 运行 的 程序 。 这 个 中 断 由 一 个 称 为 信号 的 内 该 机 制 产 生 。 信号 是 一 个 
简单 而 重要 的 概念 。 下 面 将 探讨 信号 的 基本 概念 .学 习 怎 样 使 用 它们 解决 play_again3 的 问 
题 。 在 下 一 章 中 将 更 深信 地 学 习 信 号 。 


6.4.1 Ctrl 一 C 做 什么 


输入 Ctrl-C., 程 序 便 被 终止 了 。 一 个 单一 的 击 键 是 如 何 杀 死 一 个 进程 的 呢 ” 终 端 驱动 
程序 在 这 里 起 了 相应 的 作用 , 图 6.6 显示 了 相应 的 事件 链 ， 


. AP SA Utr- C 

. Ji s FEE SIT 

. [E Be VINTR 和 ]SIG 的 字符 被 开启 
. 怀 动 程序 调用 信和 号 系统 

.信和 号 系统 发 送 SIGINT HAR 

, xt I SIGINT 

. 进程 消亡 


一 





图 6.6 Cul- mf Tff 


P da S KERAST E EE Ctrl-C, 可 以 使 用 suy( 或 者 tcsetattr) 将 当前 的 
VINTR 12 ibl SAT IRMA — Bp E 


6.4.2 信号 是 什么 


按 下 Crrl- 和 产生 一 个 信号 ,那么 信和 寻 是 什么 昵 9 信和 号 是 由 单个 词组 成 的 消息 。 绿 灯 是 
一 个 信号 ,停止 标牌 是 一 个 信号 .裁判 手势 也 是 一 个 信号 。 这 些 物 体 和 事件 不 是 消息 , EF 
和 出 界 才 是 消息 。 当 按 Ctrlj-C 时 ,内 核 向 当前 正在 运行 的 进程 发 送 中 断 信 号 。 每 个 信和 号 都 
有 一 -个 数字 编码 。 中 断 信 号 通常 是 编码 2.” 

信号 从 哪里 来 ?信号 来 自 内 核 ,生成 信号 的 请 求 来 自 3 个 地 方 , 如 图 6.7 所 示 。 

(1) 用户 

用 户 能 够 通过 输入 Ctrl-C、Crrl-\ ,或 是 终端 驱动 程序 分 配给 信和 号 控制 字符 的 其 他 任何 
键 夹 请 求 内 核 产 生 信 和 号 。 

(2) AK 

当 进 程 热 行 出 错时 ,内核 给 进程 发 送 一 个 信号 ,例如 ,非法 跨 存 取 PARRY. ee 





Q BARES shell 脚本 将 出 问题 ， 


第 6 章 为 用 户 编程 : 终端 控制 和 信号 - 169 > 





来 自 其 他 进程 的 信号 Baths 
R67 信号 的 3 种 来 产 


个 非法 的 负 器 指令 。 内 核 也 利用 信号 通知 进 程 特定 事件 的 发 生 ， 

(3) 进程 

一 个 进程 可 以 通过 系统 调用 ell 给 男 一 个 进程 发 送信 号 。 一 个 进程 可 以 和 为 一 个 进程 
遂 过 信号 通信 ，、 

由 进程 的 某 个 操作 产生 的 信 冬 被 称 为 同步 信号 (synchronous signals). BJ n , e AE KR. 
由 像 用 户 击 键 这 样 的 进程 外 的 事件 引起 的 信号 被 称 为 异步 信号 (asynchronous signals). 

QE rg ar psu x? 信号 编号 以 及 它们 的 名 字 通 常 出 现在 /usr/include/signal.h 
文件 中 .这 里 是 这 个 文件 的 一 部 分 : 


£ define SIGHUP 
# define SIGINT 
4 define SIGQUIT 
4 define SIGILL 
# define SIGTRAP 
# define SIGABRT 
H define SIGEHT 
# define SIGFPE 
H define SIGKILL 
i define SIGBUS 


/* hangup, generated when terminal disconnects K/ 

/* interrupt, generated from terminal special char «/ 
/* ( * ) quit, generated from terminal special char x/ 
/* €» ) illegal instruction (not reset when caught) «/ 
/* (* ) trace trap (not reset when caught) x/ 

/* ( 3 ) abort process «/ 

/x ( * ) EMT instruction x/ 

/* (x ) floating point exception «/ 


/* kill (cannot be caught or ignored) «/ 


oOo C - A Uu x W MN v 


-— 
e 


/* ( * ) bus error (specification exception) 4/ 


4 define SIGSEGV 11 /x (x ) segmentation violation «/ 

# define SIGSYS 12  /* ( * ) bad arqument to system call s/ 

# define SIGPIPE 13 /a write ou a pipe wich no one to read ir «/ 
H define SIGALRM 14  /» alarn clock timeout «/ 


H define SIGTERM 15 /x software termination signal +/ 


Pilon, Po s -S BR SIGINT, BBS RRA SIGQUIT, dE R TE JR SH 
SIGSEGV。 任 何 一 个 版 本 的 Unix 的 手册 都 包含 更 多 的 相关 信息 。 在 Linux 中 ,可 以 查看 
signal(7) 的 相关 联机 帮助 。 

信号 做 什么 ”这 要 视 情况 而 定 。 很 多 信号 杀 死 进程 、 茶 时 刻 进程 还 在 运行 ,下 一 秒 它 
就 消亡 了 :从 内 存 中 被 碘 除 ,相应 的 所 有 的 文件 描述 符 被 关闭 .并 有 旦 从 进程 表 中 被 删除 。 使 
用 SIGINT 消灭 一 个 进程 ,但 是 进程 也 有 办 法 保护 自己 不 被 杀 死 。 
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6.4.3 进程 该 如 何 处理 信 和 号 


当 进 程 接收 到 SIGINT 时 ,并 不 一 定 非 要 消亡 。 进 程 能 够 通过 系统 调用 signal 告 昕 内 
核 , 它 要 如 和 何 处 理 信 号。 进程 有 3 个 选择 。 

(10 BESS BRIA Gh GH a TEE T 

于 册 上 人 州 出 了 对 每 个 信号 的 默认 处 理 。SIGINT ARAR EHC. ER HAR ER 
使 用 signal 接受 默 尖 处理 ,但 是 进程 能 够 通过 以 下 调用 来 恢复 典 以 处 理 ， 


signal (SIGINT, SIG DFL); 


(2) MR a T 
fH RT VELIE SEVA P 38 HIS Er VR PLE E m 2 BR SIGINT figit 


signal (SIGINT, S1G IGN); 


C3) iH HI— 1 eR XC 

第 3 种 选择 是 3 个 当中 最 强大 的 一 种 。 考 虑 play agam3 这 个 例子 。 当 用 户 输入 Ctrl- 
C, 当 前 运行 的 程序 立即 退出 ,而 不 调用 恢复 驱动 程序 设置 的 隧 数 。 更 好 的 做 法 是 ,程序 在 接 
收 到 SIGINT 后 ,调用 一 个 恢复 设置 的 晴 数 ,然后 再 退出 。 

调用 signal 的 第 3 种 选择 允许 这 种 类 型 的 响应 。 程 序 能 够 告诉 内 核 . 当 信和 号 到 来 时 应 该 
调用 哪个 函数 . 在 信号 到 来 时 被 调用 的 阔 数 被 称 为 信号 处 理 消 数 。 为 安装 信和 号 处 理 师 数 ， 
程序 调用 : 


signal (signum, functionname); 

















signal 
E tk 简单 的 信号 处 理 
头 文 性 # include signal, k> 
Bg d m result = signal (int signum, void ( * action) Cint)); 
参数 sinoi fe P] Pr I) f 
action QO {ny Tis] Fog 
* M ] 1 zl FH bx 


prevaction 成 功 返 还 


Wal} signal 为 编码 是 signum 的 信 号 安装 新 的 信号 处 理 函 数 。actiou 可 以 是 函数 名 或 以 
下 两 个 特殊 仁之 一 。 

© SIG IGN, E FA fg 

* SIG_DFIL， 将 信号 恢复 为 默 汰 处 理 。 

signal 返 癌 前 : :个 处 理 国 数 。 值 是 指 癌 琢 数 的 指针 。 
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6.4.4 信号 处 理 的 例子 


L 448.45 3 


/x sigdemol,c - shows how a signal handler works. 


x — run this and press Ctrl -C a few times 


p include <stdio.h> 
# include < signal. h> 


main() 
| 
void F(Cint); /* declare the handler x/ 
int 1; 
signal( SIGINT, f ); /* install the handler »/ 
for (i=0; i«5;i**)| /* do something else «/ 
printf("helloMn"); 
sleep(1); 
} 
void f(int signum) /* this function is called «/ 


{ 
printf("OUCH! \n"); 


ERA oe ARAR. UE FH signal 后 进 人 一 个 循环 .sigdemol.c 调用 signal 来 设置 
SIGINT 的 处 理 函 数 {。 如 果 进 程 接收 到 SIGINT fa & ,内核 会 调用 函数 f 来 处 理 这 个 们 号。 
程序 跳 转 到 那个 函数 , 热 行 它 的 代码 ,然后 返回 到 跳 转 前 的 位 置 ,就 像 子 过 程 调 用 一 样 。 

图 6.8 显示 了 两 个 独立 的 控制 流 : 一 个 是 正常 的 路 径 , 进 入 main, PUTER. Ki 
main 返回 ;， 另 一 个 是 由 信号 引起 的 路 征 , 进 入 [. 然 后 返回 。 


SIGINT 的 到 达 将 控制 流转 向 信号 
处 理 器 ， 从 信号 处 理 器 返回 后 继续 
| 一 一 正常 控制 议 执行 原来 的 控制 流 ， 





a Fy AER LE 


6.8 信号 引起 子 过 程 的 调用 
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ULT ERE 17 TR OL 

$ . /sigdemol 

hello 

hello press Ctrl ~ C now 

OUCH I 

hello press Ctrl - C now 

OUCH I 

hello 

hello 

$ 

RRP RRS. AF PRAM PN BSA. RAN fa 50 X TAT AR 

38 CES] V] AA 

2. 忽略 信号 

/* 3igdemo2.c — shows how to ignore a signal 
y - press Ctr] - V to kill th:s ose 
x/ 


H include «x stdio. h> 
H include <csignal.h> 


nain() 


{ 
signal( SIGINT, SIG IGN ); 
printf( "you can't stop me! An"); 
while( 1 ) 
人 
sleep(1); 
print£(“haha\n") ; 


sigdemo2. c 调用 signal 来 设置 为 忽略 中 断 信 号 ， RIVA BR EC E Cul-C 而 不 会 对 进程 
产生 影响 。 
signal(SIGINT. SIG_IGN) 的 效果 如 图 6. 9 所 示 ，。 





进程 告诉 内 核 需 要 忽 赂 SIGINT 





图 6.9 signal (SIGINT. SIG_[IGN} 的 效 扣 


ey 92 —X « ，、 —À ee Per Qo — €, — — — 
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以 下 是 程序 的 运行 情况 : 


S .f8igdemo2 

you can't stop mel 

haha 

haha 

haha press Ctrl ~ C now 
haha press Ctrl - C nowpress Ctrl - C now 
haha 

haha 

haha press *\now 

Quit 

$ 


按键 组 合 Ctrl-\ 会 发 送 :- 个 不 同 的 信和 号 , 即 quit fi ox TEES E E ok d E 
SIGQUIT. 


6.5 为 处 理 信号 做 准备 : play againd. c 


现在 已 经 知道 如 何人 收 改 play, again3. c 来 处 理 信 号 , 八 是 还 需要 做 一 个 设计 决策 。 需 要 
把 略 信号 并 让 用 户 回答 yes 或 no 吗 ?” 要 捕捉 键盘 信 续 吗 ? 当 用 户 输入 no 时 ,要 再 接 退 出 还 
是 先 返 回 一 个 值 表示 程序 已 经 消亡 ” 

下 面 这 个 程序 版 本 捕捉 SIGINT , 重 置 驱动 程序 ,然后 返回 no 的 代码 ， 


/* play again4.c 
* purpose; ask if user wants another transaction 


* method; set tty into chr - by - chr, no - echo mode 


* set tty into no- delay mode 
* read char, return result 
¥ resets terminal modes on SIGINT, igneres SIGQUIT 


+ returns; 0 => yes, 1 =>no, 2=>timeout 


* better; reset terminal mode on Interrupt 


* / 
H include «stdio. h> 
# include <termios. hi 
# include <_fentl. h> 
# include < string, h> 
H inciude = siqnal. h> 
# define ASK "Do you want another transaction" 
H def ine TRIES à ix Wax tries x! 
H define SLEEPTIME 2 /* time per try »/ 


H define BEEP putchar( 'Xia?) /* alert user */ 
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—  '—X  '— aa" — ee 


maint) 


i 


1 
I 


get response( char * question , int maxtries) 


D 
? 
i * 


int response > 


void ctrl c handlertint); 


tty mode(O): 

set cr noecho mode(); 

set nodelay model}; 

signal( SIGINT, ctr]! c handler }, 
signal( SIGQUIT, SIG IGN ) :; 


response = get response(ASK, TRIES}; 


tty mode(1) - 


return response: 


/« save current mode */ 

/* set — icanon, - echo «/ 
/* noinput -2» EOF «/ 

jx handle INT «/ 

/* ignore QUIT signals «/ 
/« get some answer x/ 


/* reset orig mode «/ 


* purpose: ask a question and wait for a y/n answer or timeout 


* method: use getchar and complain about non- y/n input 


* returns: 0 => yes, i -72no 


i 


X 


i 


: 


i * 


int input; 


printf("* s (y/n)?", question); 
fflush(sidout); 
while ( 1 3{ 


sleept SLEEPTIME) ; 


F 


input = tolower(get ok char()):; 


if ( input == tyt) 
return Q: 

if ( input == 'n') 
return 1; 

if ( maxtries-- == 0) 
return 2; 


BEEP ; 


/* ask */ 


/* force output x/ 


/* wait a bit «/ 


/* get next chr x/ 


/* outatime? x/ 


/* Sayso x/ 


* skip over non— legal chars and return y,Y,n,N or EOF 


" 


my 


get ok chart?) 


r 


i 


int Cs 


while( ( c = getchar() } 1= EOF && strchr("yYnN",c) == NULL) 


a 
了 
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return €; 
I 
Sek cr noecho_mode() 


/x 


* purpose; put file descriptor 0 into chr - by - chr mode and noecho mode 


* method: use bits in termios 
* 
{ 


struct termios ttystate: 


tcgetattr( D, &itystate) ; 
ttystate.c lflag &= --ICANON; 
ttystate.c lflag &= ~ECHO; 
ttystate.c_ccl VMIN| = 1; 
tcsetattr( 0 , TCSANOW, &ttystate); 
i 
set nodelay mode) 


J% 


/* read curr, setting */ 
/* no buffering x/ 

/* tio echo either */ 

/* get 1 char at a time x/ 


/* install settings «/ 


* purpose: put file descriptor 0 into no- delay mode 


* method; use fenti to set bits 


* notes: tcsetattr() will do something similar, but it is complicated 


x, 

| 
int termflags- 
termflags = fcntl(0, F_GETFL}: 
termfiags | = O NDELAY; 


/* read curr. settings x/ 


/^* flip on nodelay bit */ 


fcntl(O, F_SETFL, termflags); /* and install 'em x / 
t 
/* how == 0 => save current mode, how s= 1 => restore mode */ 
/* this version handles termios and fcntl flags » f 


tty mode(int how; 

| 
Static struct termios original, mode; 
static int original flags; 


static int stored = Ü- 


f 


if ( how == 0| 
tcgetattr(0, &original mode); 
original flags = fentl(0, F_GETFL); 
stored = 1; 

} 

else if ( stored) { 


tesetattr(0, TCSANOW, &original mode). 


fcntl( 0, F SETFL, original flags); 


f 
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void ctrl c handler¢int signum) 

ix 
< purpose; called if SIGINT is detected 
* action; reset tty and scram 
x / 


l 
1 


tty modetl); 
exitt 1} 1 


其 他 的 设计 贸 作 练习 。 
6.6 进程 终止 


程序 使 用 signal 来 告 激 内 核 它 需要 多 略 哪些 信和 号。 如果 有 人 编写 了 一 个 将 所 石 类 型 的 
ASI BA SIG_IGN 的 程序 ,然后 执行 一 个 无 眼 循环 将 会 如 和 何 昵 ? 

华 好 ,对 系统 管理 员 ( 和 程序 员 ) 来 说 ,Unix 不 可 能 让 -个 程序 永 不 停止 。 有 两 个 迟 号 是 
不 能 被 忽略 和 捕 圳 的。 阅读 于 旭 屁 头 文件 中 的 信号 列表 ,看 看 哪些 信号 是 木 可 阻挡 的 


6.7 为 设备 编程 


现在 已 经 了 解 】 了 编 与 终端 控制 程 厅 的 三 个 方面 。 首 抑 , 学 习 了 驱动 程序 的 属性 和 如 何 
控制 连接 。 然 后 ,学习 了 应 用 程序 的 特定 需求 ,并 吝 整 卫 动 程序 以 满足 这 些 需求 。 最 后, 学 
JT MaRS 一 中 断 的 一 种 形式 。 

这 二 个 方面 对 所 有 的 设备 都 适用 。 考 虑 一 块 声 卞 或 一 个 磁盘 强 动 竹 序 。 设备 有 许多 种 
Hie RAPT HAA. 需要 了 解 这 些 设置 。 同 梓 , 程 序 必 须 实 现 特征 的 功能 ,调整 驱 
动 穆 序 以 满足 这 些 需求 。 Rm RE RARE e re PO Ree ea. ee 
蝶 动 程序 可 能 在 它 结束 从 磁盘 到 内 存 数 据 块 的 复制 时 发 送 一 个 信号 ,程序 必须 能 够 对 这 些 
fc e d S A. 


小 Zi 


1. 主要 内 容 

* 有 些 程序 处 理 从 特定 设备 来 的 数据 。 这 些 与 特定 设备 相关 的 穆 序 必须 控制 与 设备 的 
HER. Unix 系统 中 最 常 匈 的 设备 是 终端 。 

。 终 痊 驱 动 程序 有 很 多 设置 。 各 个 设置 的 特定 值 决定 了 终端 驶 动 程 序 的 模式 。 为 用 记 
编写 的 程序 通常 需要 没 置 终端 张 动 程序 为 特定 的 异 式 。 

© 键 堆 输入 分 为 3 类 ,终端 驱动 程序 对 这 些 输 人 做 不 同 的 处 理 。 大 多数 键 代 胡 常 规 数 
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据 , 它 们 从 驱动 程序 传输 到 程序 。 有 些 键 调用 驱动 程序 中 的 编辑 函数 。 如 果 按 下 制 
除 键 ,驱动 程序 将 前 一 个 字符 从 它 的 行 缓冲 中 删除 ,并 将 命令 发 送 到 终端 屏幕 ,使 之 
从 显示 器 中 删除 字符 。 最 后 ,有 些 键 调 用 处 理 控制 函数 。Ctrl- 忆 ee od TE Y ya 
用 内 核 中 某 个 函数 ,这 个 函数 给 进程 发 送 一 个 信号 。 终 端 驱动 程序 文 持 春 于 种 处 理 
控制 函数 ,它们 都 遂 过 发 送信 号 到 进程 来 实现 控制 ， 
" 信和 号 是 从 内 核发 送 给 进程 的 一 种 简短 消息 。 信 和 号 可 能 来 日 用 户 .其 他 进程 或 内 核 本 
身 。 进 程 可 以 告诉 内 核 , 在 它 收 到 信号 时 需要 佑 出 和 皇 样 的 啊 应 。 
2. 进一步 的 问题 
Unix 系统 总 是 从 很 多 终端 或 其 他 设备 接收 数据 。 用 户 可 能 在 任何 时 刻 输入 数据 ,内 核 
必须 处 理 这 些 输 入 。Unix 系统 问 时 运行 车 十 个 程序 。 内 核 如 何在 同一 时 刻 维护 多 个 并 发 的 
任务 并 对 多 个 不 可 预知 的 中 断 作出 响应 呢 ? 下 一 章 将 通过 编写 一 个 计算 机 游戏 程序 米 探讨 


这 个 问题 。 
习题 


3. 
6.1 


6. 2 


很 多 Unix 软件 工具 人 共 命 令 行 指 定 的 文件 中 读 虑 数据 。 命 令 tr 不 是 这 样 。tr 是 用 
来 干什么 的 ?能 想 出 尼 不 接受 命令 行 指定 文件 名 的 原因 吗 ? 还 有 其 他 仪 从 标准 
输 人 读 取 数据 而 不 从 指定 的 文件 中 该 取 数 据 的 Unix LH? 大 多数 的 Unix fà 
S {2 8 ZTE /bin, /usr/bin Al/usr/local/bin Ae. 


任何 文件 描述 符 都 有 QO NDELAY 这 个 属性 ,而 不 仅仅 是 终 册 旺 动 程序 的 属性， 
这 意味 着 这 个 属性 适用 于 磁 盟 文件 ,也 适用 于 设备 文件 ， 

对 磁盘 文件 来 说 , 非 阻塞 性 意味 着 人 人 么 ? 除了 终端 文件 , 非 阻塞 性 对 设备 意味 着 
什么 ? 


4. 编程 练习 


6.3 


6.4 


X FE Hai FF BY AE AL F EH XE uk EGR CBSE BH SEO EEG. 终端 驱动 程序 提供 了 其 他 
选择 , 它 介 许 对 输入 设置 起 时 间隔 。 驱 动 程序 termios 结构 体 中 的 控制 字符 数组 c 
cc 在 位 置 VTIME 的 元 素 是 用 来 设置 以 毫秒 为 单位 的 超时 间隔 。 因 此 ,sc_ec 
LVTIME] = 20 会 将 驱动 程序 的 超时 设置 为 s. 

改写 play_again3. ec, 使 得 它 使 用 驱动 程序 中 的 超时 特征 ,而 木 再 将 文件 描述 符 置 
于 非 阻塞 模式 。 


在 play again 中 处 理 信 号 。 

(1) 修改 play_again3. c, 使 得 它 忽略 键盘 信号 ,而 仅 对 yes 或 no 做 出 啊 应 

(2) 修改 play again3. c, 使 得 它 在 收 到 键盘 信号 后 , 重 置 终端 属性 并 以 返回 值 2 退 
Hi . 


修改 rotate. c, 使 得 它 能 够 改变 ty 的 模式 。 修 改过 的 程序 应 该 关闭 规范 模式 ,并 
且 关 闭 回 显 。 然 后 它 读 取 字符 并 显示 字 峡 表 中 的 下 一 个 字 忍 。 当 用 户 控 下 字母 
“QH ,程序 应 该 恢复 tty 设置 并 退出 ， 

你 的 程序 应 该 忽略 键盘 信号 或 通过 在 退出 之 前 重 置 驱动 程序 来 对 它们 进行 处 理 。 
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6. 6 


6.7 


6.8 


6.9 
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编写 一 个 行 编辑 器 。 编 写 运 行 在 非 规 范 模式 程序 的 一 个 问题 是 缺乏 输入 编辑 。 
修改 纠正 过 的 rotate. ce, 使 之 支持 字符 和 行 编辑 。 特 别 地 , 当 程 序 收 到 一 个 退 格 或 
删除 字符 时 , 它 从 拼 闫 上 删除 前 一 个 字符 。 为 删 作 一 个 字符 ,程序 需 磺 打印 一 
退 格 字符 一 个 空格 字符 ,然后 又 一 个 退 格 字符 。 

同时 ,修改 程序 ,使 得 它 能 够 像 终 端 驱 动 程序 那样 处 理 行 删除 字符 。 也 就 是 ,从 屏 
幕 上 删除 当前 输入 行 的 所 有 字符 。 

需要 做 什么 以 实现 驱动 程序 的 单词 删除 功能 呢 ? 


修改 程序 sigdemol. c, 使 得 它 能 够 对 用 户 按 下 的 Ctrl-- 忆 个 数 进行 计数 。 修 改过 
的 程序 将 显示 OUCH! ,然后 QUCH11, 即 感 噶 导 的 个 数 和 处 理 函 数 被 调用 的 次 数 
相等 。 

除了 显示 递增 的 感叹 号 ,程序 庶 度 能 够 接受 一 个 整数 作为 命令 行 参 数 。 在 用 户 按 
下 Ctrl- 的 次 数 与 那个 整数 相等 之 后 ,程序 应 该 退出 。 


修改 程序 sigdemol. ce, 使 得 它 能 够 询问 用 户 是 否 真 的 要 终止 程序 。 运 行 的 样 例 如 
下 所 示 ， 
hello 
hello 
Interrupted! OK to quit (y/n)? n 
hello 
hello 
Interrupted! OK to quit (y/n)? y 
$ 
如 果 当 程序 在 等 符 用 户 回答 OK to quit (y/n)? 问题 时 ,用 户 护 下 Cel C ERE 
EMAR? 实现 上 述 程 序 , 并 观察 发 生 的 现象 。 


程序 能 够 使 用 signal 告诉 内 核 它 需 要 忽略 特定 的 信号 , 像 SIGINT 和 SIGQUIT, 
另 一 种 不 同 的 方法 是 一 开始 就 杜绝 这 些 信 号 的 产生 。 终 端 驱动 程序 有 一 个 称 为 
ISIG iri. REFUSE PR RRR. RRA PRR 
sigdemoZ. c, 

当 修 改过 的 程序 接收 到 从 键盘 以 外 的 地 方 发 送 来 的 SIGINT 信号 时 ,程序 将 做 什 
A? 学习 命 令 kill, HER kill 发送 SIGINT 到 关闭 了 ISIG 的 那个 版 本 的 程序 ， 


中 新 并 不 总 是 破坏 性 的 。 想 象 你 正在 做 一 个 需要 若干 天 的 项 目 。 你 可 能 收 到 老 
板 询问 工作 进展 的 电话 。 这 些 中 断 是 用 来 调用 状态 报告 的 子 程序 的 ,而 不 是 用 
来 杀 死 进程 。 编 写 一 个 执行 耗 时 任务 的 程序。 例如 ,编写 一 个 使 用 较 慢 的 方 
法 寻找 素数 的 程序 。 程 序 需 要 女足 它 到 目前 为 止 所 找到 的 最 大 的 素数 。 实 现 一 
个 SIGINT 的 处 理 兹 函数 ,这 个 出 数 用 来 显示 它 所 找到 的 素数 的 个 数 议 及 素数 的 
KX fA. 

这 个 想法 如 何 运用 在 系统 编程 中 ? 


hh 


6.11 


6. 12 
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c —À 800 


在 第 1 章 中 ,实现 了 几 个 版 本 的 more, ARTF A A iB 20 iy fe zh SA x PE 
改进 那个 程序 ,使 它 运行 无 回 显 . 非 规范 模式 中 ,并 能 对 中 断 和 终止 伯 号 做 出 正 
88 EF RET AY, 








——o e A ——————— «€ 


用 户 不 仅 能 够 通过 按键 产生 全 号 ,也 能 通过 改变 终端 窗口 的 大 小 产生 信号 。 窗 
口 每 次 改变 大 小 时 ,SIGWINCH 就 第 发 送 到 进程 。 按 黔 认 处 理 , 进 程 将 忽略 
SIGWINCH 信和 号。 编写 一 个 程序 ,使 得 能 够 在 屏幕 上 打印 满 屏 的 字母 “A”。 例 
如 ,如 果 窗 口 有 10 行 20 列 , 程 序 要 显示 字母 “A”200 次 。 当 窗口 大 小 改变 时 , 程 
序 用 宇 母 "B" 填 充 整 个 屏幕 。 下 一 次 ,使 用 “CC ”以 此 类 推 。 当 用 户 按 下 字母 "<Q” 
时 , 屏 芽 消除 ,程序 退出 。 当 用 户 按 下 其 他 任何 键 时 ,屏幕 从 字母 "A" 重 新 开始 。 


第 7 章 事件 驱动 编程 : 编 与 
一 个 视频 游戏 





概念 与 技巧 

。 Fae SE aK) aa E 

。 curses FE. 目标 和 使 用 
。 XE Alla) NS TEES 

。 可 靠 的 信和 号 处 理 

。 可 重 入 代码 .临界 区 

。 异步 输入 

相关 的 系统 调用 和 函数 

* alarm, setitimer, getitimer 
* kill, pause 

e sigaction,sigprocmask 


* fenti, aio read 


7.1 视频 游戏 和 操作 系统 


贝尔 实验 室 的 Dennise Ritchie 和 Ken Thompson 为 了 二 一 个 叫 橄 星际 旅行 的 视频 游 
w, TEAB T Unix. Ritchie Bik: 

Thompson Æ 1969 WFE T CER miT ie PE, A RA Multics 操作 系统 上 ,然后 用 Fortran 
移植 到 GECOS(GE 上 运行 的 .… 个 操作 系统 ,后 来 在 Honeywell 635 上 和 运行) 。 那 是 一 个 由 玩家 在 模拟 的 移 
动 太阳 系 中 ,根据 屏幕 上 显现 的 环境 引导 飞船 在 不 同 的 行星 或 卫星 上 降落 的 游戏 。GECOS 上 的 这 个 版 本 
在 两 个 重要 方面 并 不 令 人 满意 : 第 一 ,游戏 的 显示 有 些 不 连 吐 ,同时 通过 部 击 命令 来 控制 很 难 人 掌握 ;第 二 , 游 
戏 需 要 在 一 台大 者 机 上 大 约 花费 75 美元 的 CPU 时 间 来 运行 。 所 以 不 入 以 后 ,Thompson 8 £l — t 18 £7 di 
用 的 PDP-7 计算 机 ,这 侣 机 器 有 很 棒 的 显示 处 理 器 , 整个 系统 被 当做 Graphic ll MA. HARES Ce 
RT HERE ER AUB EL. SRL AHR LB LEP MORO. BRIM TMA 
人 存 的 软件 ,所 以 不 得 不 宇 一 个 浮 点 运算 包 ,显示 特性 的 点 序 规 档 说 明 , 以 及 -- 个 在 屏幕 角 上 连续 显示 输入 内 
AA Hee TAS. 所 有 这 些 都 县 用 汇编 语言 写 的 ,用 - :个 在 GECOS 上 的 交叉 汇编 器 编译 到 PDP-7 的 纸 
市 上 。 
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星际 旅行 3 尽 息 是 一 个 非常 吸引 人 的 游戏 ,但 也 只 是 主要 作为 学 习 复 杂 的 PDP? BRA AB REL IE. 
不 入 以 后 Thompson 开始 实现 一 个 之 前 就 已 设计 好 的 纸 带 文件 系统 (paper file system) (或 者 说 粉笔 文件 系 
统 即 chalk file system 重 加 合适 )。 在 流 有 练习 的 情况 下 试图 建立 一 个 文件 系统 是 非常 困难 的 ,所 以 他 继续 
以 - -个 实用 操作 系统 的 其 他 功能 来 充实 自己 的 系统 ,上 尤其 是 进程 的 概念 。 然 后 是 小 部 分 用 让 级 的 工 上 其: 
复制 .打印 ,删除 种 编辑 交 件 的 十 有 具 。 当 然 还 有 -一 个 简单 的 合 令 解释 涡 (shetl) 。 直 到 此 时 所 有 的 程序 还 是 
Æ GECOS 上 写 的 ,然后 用 纸 直 转移 到 PDP-7 上 ,但 是 一 已 有 一 个 自己 前 汇编 器 它 就 吓 以 交 持 和 白 己 了 。 人 尽管 
E fJ 1970 年 Brian Kernighan 才 建 议 使 用 Unixt 某 种 程度 上 有 点 像 Multics MRK Kay KR. MS P 
知 这 个 操作 系统 已 经 诞生 了 . . 

视频 游戏 和 操作 系统 有 很 多 共同 点 。 在 本 和 章 中 将 完成 一 个 倘 单 的 视频 游戏 。 通 过 这 个 
例子 来 介绍 更 多 的 Unix 系统 服务 一些 基 本 原则 和 操作 系统 设计 技术 ， 

l. PUB BERR RP A 

76 TR — TH PST AY Se REG a BA fb Dr HS 
影像 HEETE A. H-THKAA CH BOE A. 动力 和 其 他 一 些 属性 .物体 之 
站 社工 作用 .一 个 流星 可 能 撞 上 上 A HAE N E 

注 戏 同时 要 啊 几 用户 竹 人 人 。 洲 戏 玩家 和 们 通过 按 扬 .鼠标 和 轨迹 球 在 任何 时 刻 部 有 有 可 能 
生成 输 人 人 , 程 夺 必 雏 在 很 短 的 时 间 里 作出 响应 。 这 些 输入 事件 会 影响 游戏 中 物体 的 属性 。 
通过 按 下 按钮 ,用 户 可 以 增加 飞船 速度 或 是 减少 飞船 质量 。 飞 船 的 变化 会 影响 它 与 其 他 物 
体 的 作用 方式 ， 

2， 视 频 游戏 如 何 做 

一 个 视频 游戏 绽 合 了 一 些 基 本 的 概念 积 原则 。 


C1) 73 [B] 
HF RP i AE BLE ae Be Se. EJT UnA 5 o iz? 
(2) 时 间 


影像 以 不 同 的 速度 在 屏幕 上 移动 。 以 : -个 特定 的 时 间 间 隔 改 变 位 鸭 。 程序 是 如 何 获 知 
时 间 并 且 人 在 特定 的 时 间 安 排 事 情 的 发 生 ? | 

(3) 中 期 

程序 在 屏幕 上 平 请 的 移动 物体 ,用 户 可 在 任意 时 刻 产 生 输 入 。 程 序 是 如 何 响应 中 断 的 ? 

O 同时 做 几 件 事 

游戏 必须 在 保持 几 个 物体 移动 的 同时 还 避 响 应 中 断 。 程 序 是 如 和 何 同 时 做 多 件 事 情 而 不 
fg FFAG Re 3E fg [n] AD? 

3. FACE E St da ds £12 43 je] 

操作 系统 同样 要 面 对 这 土 个 问题 。 内 核 将 程序 载 人 内 存 空 间 并 维护 每 个 程序 在 内 存 中 
所 处 的 位 置 。 在 内 核 的 调度 下 ,程序 以 时 间 片 间 明 的 方式 运行 ,同时 ,内 核 也 在 特定 的 时 刘 
运行 特定 的 内 部 什 务 。 内 核 必 须 在 很 短 的 时 间 内 响应 用 户 和 外 设 存 任何 时 刻 的 和 输入。 同时 
做 了 几 和 尾 事情 需要 一 些 技巧 。 内 核 是 站 何 保证 数据 的 有 序 和 规整 的 ? 

4. ARER AES AS EI 

AS ERE AS DECRE RB ,时间 ,信号 和 如 何 安 全 地 同时 做 玫 件 事情 。 为 了 学 习 这 4 个 基本 
主题 ,将 编写 一 个 基于 字符 终端 的 动画 游戏 . 

为 什么 是 基于 字符 的 图 形 翼 面 ? 
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为 什么 不 用 强大 的 X11 来 编程 或 者 是 Java 来 绘图 ? 这 里 有 很 多 原因 。 首 先 , 基 于 宁 符 
的 游戏 除了 每 个 像素 大 些 外 ,其 他 与 高 分 辩 率 的 图 形 界 面 游戏 非常 相似 。 其 次 是 可 移植 性 。 
字符 图 形 界面 游戏 只 需要 --- 个 终端 模拟 器 和 一 个 连接 ,这 些 是 每 个 系统 都 提供 的 。 第 二 ,在 
绘图 上 省 下 来 的 时 间 可 以 用 存 系统 编程 上 。 尽 管 如 此 ,如 果 喜 欢 更 好 的 图 形 界面 ,网 站 上 有 
这 个 游戏 的 其 Windows fea, 


7. 2 任务 : LA SHER WEAR (Pong) 


现在 开始 了 了。 本 章 的 主要 任务 是 实现 一 个 在 游戏 房 和 家 庭 中 常见 的 经 典 游戏 一 一 BR 
游戏 。 图 7. 1 显示 了 它 的 3 个 主要 元 素 : BRA. "ms 

(OD 球 以 一 定 的 速度 移动 ; 

(2) 球 碰 到 墙壁 或 挡 板 会 被 弹 回 ; 

(3) 用 户 按 按钮 来 控制 挡 板 上 下 移动 ， 


Ce 


Siete kd 


BE: ALP irm 
R: BEER EMS 





目标 : 不 引 球 飞 出 去 


ra 





图 7.1 单 人 视频 游戏 


写 这 个 游戏 需要 了 解 如 何 管 理 屏 幕 , 时 间 和 中 断 ,还 要 理解 如 何 安全 地 同时 做 儿 件 事 
情 。 下 面 一 样 一 样 来 学 。 


7.3 Miete: curses JE 


curses 库 是 一 组 函数 .程序 员 可 以 用 它们 来 设置 光标 的 位 置 和 终端 屏幕 上 显示 的 字符 样 
X, curses 库 最 初 是 由 UCB 的 开发 小 组 开发 的 。 大 部 分 控制 终端 屏幕 的 程序 使 用 curses, 
和 曾经 由 一 组 简单 的 尔 数 组 成 的 库 现在 包括 了 许多 复 订 的 特性 。 这 里 将 使 用 革 中 很 少 一 部 分 
的 功能 ， 


7.3.1 介绍 curses 


curses 将 终端 屏幕 看 成 是 由 字符 单元 组 成 的 网 格 , 每 一 个 单元 由 ( 行 、 列 ) 坐标 对 标示 。 
AB Tp Ak BU Bn e de BERE HU Ic fü (TE PR EE Em PETS IPLA BS B AES. 7.2 7R T 
curses JEJ. 

curses AA HARET RARA S) AR BE E d oc s BS FF BE RH 
DA BERE EM ESSERE Oo) HA b A ED E RI P OW R fib OC A 
域 。 用 户 手 册 有 curses BEA AARI EMRE., IX EGER SIL HE 9 T. 
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一 CC 一 一 一 一 一 一 


1 
i] 





}. 
ES 


d 


move [5 
addstr 


E 
I" 
(3$ 
oy 
S3 
i. 
da 
ar 


Lr 


E] 7.2 curese WIR 25 [e] £& 


一 -一 


peg 


("nello") 








— 


initscr(? 
endwin ) 
refresh() 
movet r.c) 
addstr(s) 
addch(c? 
cleat() 
standout() 


standend{ > 


基本 curses 函数 


A Re d curses E FI ity 


关闭 curses YEE tty 

使 屏幕 按照 怀 的 意图 显示 
移动 光标 到 屏幕 的 (r,c) 位 置 
ESM SAR s 

TE H B Pr UB FF c 


1H BE 


启动 standout 模式 {一般 使 屏幕 反 色 } 
关闭 standout 模式 





curses 例 1. hellol. ¢ 


第 一 段 程序 展示 了 一 个 curses 程序 的 基 丰 逻辑 ; 


/* hellol.c 


* purpose show the minimal calls needed to use curses 

* outline initialize, draw stuff, wait for input, quit 
j 

X, 


# include  «stdio.h 


'#include < curses. h> 


maint) 
í 


initscr() ; 


clear(}: 
move(10,20) : 


addstr("Hello, world"); 


move(LINES- 1,0}; 
refresh(); 


getch(): 


/* 
fx 
f * 
oe 
i% 
/ k 


ES 


fx 


turn on curses*/ 
send requests */ 
clear screen x/ 
rowl0,col20 x/ 

add a string */ 

move to IL x,’ 

update the screen «/ 


wait for user input x*/ 
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一 一 一 





endwint ) ; ‘x turn off curses */ 


编译 和 运行 程序 非常 简单 : 
5 ec hellol.c - 1 curses - o hellel 
$ ,/hellei 


"— ween 


输出 如 图 ?7.3 所 小 。 这 个 程序 在 连接 到 任何 Unix 系统 的 任何 终端 上 都 能 运行 。 





图 7.3 第 一 个 基于 curses 的 程序 


curses ffi 2. hello2. c 
将 curses 图 数 与 循环 TRAE AR E — db RR Po EE AR Ro GHE. RM UI 
下 第 2 个 例子 的 输出 ; 


/* hello2.c 
* purpose show how to use curses functions with a loop 
* outiine initialize, draw stuff, wrap up 


其 了 


# include <(stdio. h> 


# include «curses, h> 


maint > 

\ 
int i. 
initscré?; /* turn on curses x/ 
clear(); /* draw some stuff «/ 
for (i=0; i< LINES; it+ )i /* ina loop */ 


move( i, iti); 

if ( i%2 == 15 
standout() ; 

addstr( "Hello, world"). 

if(i1&*2 == 1) 
standend(} ; 
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refresh); /* update the screen x/ 
getch(); /x wait for user inputs / 
encdwint) ; /* reset the tty etc a” 


编译 并 运行 它 。 你 的 癫 测 正确 吗 ? 
7.3.2 curses 内 部 : 虚拟 和 实际 屏幕 


refresh pA Eg T ÆA? 试验 -下 : 注释 挤 该 行 , 重 新 编译 ,运行 程序 。 结 果 是 什么 部 
没有 出 现在 屏幕 上 ， 

curses 设计 成 为 能 够 在 不 阻塞 通信 线路 的 情况 下 更 痢 文 本 屏幕 。curses 30 cT e M Di 4 
(如 疼 7.4 所 示 ) 来 最 小 化 数据 流 越 、 


addstr 写 人 屏幕 缓存 RABE 











Eur ks 


= iius 
refresh 更 新 真实 屏幕 
图 7.4 Curses 保持 真实 屏幕 的 副本 





真实 屏幕 是 眼前 的 一 个 字符 数组 。curses 保留 了 屏幕 的 两 个 内 部 版 本 。 一 个 内 部 屏幕 
是 真实 屏幕 的 复制 。 另 一 个 是 工作 屏幕 ,其 上 记录 了 对 屏幕 的 改动 。 每 个 映 数 ,比如 move, 
addstr 等 都 只 在 工作 屏幕 上 进行 修改 。 工 作 屏 幕 就 像 磁盘 缓存 ,curses 中 的 大 部 分 的 函数 都 
上 只 对 它 进行 修改 ， 

refresh 2835 t Ez T lE BE SCRI ELSE BERE IM XE Re. SA I refresh 通过 终 况 驱动 送出 那些 能 
使 真实 屏幕 与 工作 屏幕 一 致 的 字符 和 控制 合 。 例 如 ,如 果真 实 屏 幕 的 左上 角 是 Smith, 
james, 然 后 用 addstr 把 Smith Jane 放 在 相同 的 位 置 ,调用 refresh 也 许 只 是 用 n 和 空格 替换 
J James 中 的 m 和 s。 这 种 只 传输 改变 的 内 容 而 不 是 影像 本 身 的 技术 被 用 在 视频 流 中 、. 


7.4 时钟 编程 : sleep 


为 了 写 一 个 视频 游戏 ,需要 把 影像 在 特定 的 时 间 置 于 特定 的 位 置 。 用 curses ER IR 
于 符 定 的 位 置 。、 然 后 在 程 订 中 添加 时 间 响 应 。 第 1 步 使 用 系统 隆 数 sleep. 
By ii PIF 1; hello3. c 


/» hello3.c 


* purpose using refresh and sleep for animated effects 


RN 四 + Pr P ee AIL tt + 
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aso 





mm 


* outline initialize, draw stuff, wrap up 
x / 
£ include  -stdio.hc- 


f include  «curses. h-- 


mainí) 


d 


int i; 


initscr(); 
clear(); 


forí(i- Q- 


;SAeLINES; itt ): 
move( i, iti»; 
if (i%2 == 1} 
standout); 
addstr("Hello, world"); 
if i%2 == 1) 
standendt ) ; 
sleepil;; 
retresh(); 
} 
endwint } ; 


1 
I 


当 编 译 并 运行 这 个 程序 的 时 候 , 将 看 到 hello ^m £r B YEBESE B LI KADER. RPE 
加 一 行 , 反 色 和 正常 显 上 下 区 圭 出现。 为 什么 在 每 次 循环 结 东 都 要 调用 refresh? 如 果 不 这 样 
会 有 什么 效果 ? 

动画 例子 2: hellot. c 


/* hello4.c 

* purpose show how to use erase, time, and draw for animation 
x/ 

i include -<stdio.h> 


4 inciude = curses. h> 


maint } 


initscr(o)4 
clear(); 


for(i- O0: 


; i«TLINES; it* }{ 

Rove( i, iti}; 

if ¢j%2 == 1) 
standout}: 

addstr( "Hello, world"); 


if (1% 2 == 1} 
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standend() ; 


refresh(); 


sleep(l1); 
move(i,it ij; /* move back «/ 
addstr(" "); /* erase line x/ 
; 
ergdwin(); 


j 


hello4 APER 22854 iR. EE OR IG ONE PB REX TE., WREE T RS JT ELE. 
符 串 ,睡眠 1 秒 钟 ,然后 在 原来 的 地 方 夯 空 字符 串 以 删除 原 有 影像 ,最 后 将 输出 位 置 推 进 。 注 
意 在 两 次 请 求 之 后 通过 调用 refresh 来 保证 每 次 循环 后 上 日 的 影像 消 朱 ,新 的 影像 显示 。 
7.5 是 屏幕 的 一 个 快照 。 





图 ?7.5 "FT B IP SEA 


T— BITE AF a TE TRO RE HO DE 
动画 例子 3: hellod.c 


/* hello5.c 

* purpose bounce a message back and forth across the screen 
* compile cc hello5.c - icurses - o hello5 
7 

# include < curses. h> 


H define  LEFTEDGE 10 
H define  RIGHTEDGE 30 


H define ROW 10 
ainí) 

i 

char message = "Hello"; 
char blank = " * 


int dir = +1; 
int pos = LEFTEDGE ; 


initscr(); 


clear(); 
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while(1)| 
move(ROW, pos) ; 
addstr( message ): /x draw string */ 
move(LINES — 1,COLS- 1); /* park the cursor */ 
refresh(); /* show string »/ 
sleep(1)»; 
move( ROW, pos) ; /* erase slLring */ 
addstr( blank ); 
. pos *- dir; /* advance position */ 
if ( pos “>= RIGHTEDGE ) /* check for bounce «/ 
dir = -1; 
if ( pos <= LEFTEDGE ) 
dir = *1; 


变量 dir 用 来 控制 宁 符 品 移 动 的 速度 。 当 dir 是 一 1 时 ,字符 串 每 一 秒 向 右 移 动 一 肇 。 
当 dir E — 1 np," TER HERE ARF, dE dir 的 符 吕 就 改变 了 字符 串 移 动 的 方向 。 
B] 7.6 是 某 一 特定 时 刻 屏幕 的 快照 。 


ZEE Hello, world 





图 7.6 宁 符 申 弹 来 弹 去 


更 在 该 如 何 做 ? 

现 在 网 能 够 号 出 一 个 像样 的 动作 类 视频 游 戏 有 网 远 ? 已 经 知道 了 如 何在 屏幕 的 任何 地 
方面 字符 串 , 世 知道 了 了 如何 通过 赣 , 掠 掉 和 重 画 之 间 反 人 时 延 米 创造 动画 效果 。 和 馆 今 实现 的 
程 夺 还 不 错 , 只 是; 


(1) … 秒 钾 的 时 延 太 长 , 帝 要 更 精确 的 计时 器 ; 
(2) ds 38H D EP Sr AL. 
ji Eng lu EI ART BPA RS OE. MAI ,将 再 次 回 到 这 个 游戏 。 


7.5 时 种 编程 1: Alarms 


程序 可 到 以 不 隔 的 方式 使 用 时 钟 。 可 以 用 来 在 执行 让 中 加 和 时 延 。 前 面 的 3 个 例子 里 
用 sleep 加 入 时 延 。 时 钟 的 男 一 个 用 途 是 调度 一 个 将 来 要 做 的 任务 ,就 像 拨 好 一 个 者 鸡 重 的 
定时 请 ,然后 干 别 的 事情 互 到 定时 器 鸭 叫 。 同 样 的 日 的 ,Unix 提供 alarm, 
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7.5.1 RDNA HE: sleep 
为 了 在 程序 中 请 加 时 延 . 全 用 sleep 28 X . 
sleep(n) 


sleep(n) 和 将 当前 进程 挂 起 n 秒 或 者 在 此 期 间 被 一 个 不 能 忽略 的 信号 的 到 达 所 唤醒 。 
7.5.2 sleep() 是 如 何 工作 的 : 使 用 Unix 中 的 Alarms 


sleep K% AY 14E ELSE VR AB WE xg IK np ful ae — RE: 

(1) i EIS] BP SII IRAE BE BEP ; 

(2) WES, ÉL UBI RO t s Oe . 

£g 7. 7 证 这 个 机 制 的 示意 图 .系统 中 的 每 个 进程 都 有 一 个 私有 的 闹钟 (alarm clock). 
这 个 闸 钟 很 像 一 个 计时 器 ,可 以 设置 在 一 定 秘 数 后 闸 铃 。 时 间 一 到 ,时 钟 就 发 送 一 个 信号 
SIGALRM 到 进程 。 除 非 进 程 为 SIGALRM i Ye T Ab Ei p Yr Chandler) ,否则 信号 将 杀 死 这 
个 进程 。sleep 函数 由 3 个 步骤 组 成 : 

l. ÀJ SIGALRM UL — T AE PERS ; 

2. JH] alarm(num. seconds) ; 


3. JJH pause, 


slecp 余数 是 如 何 工作 的 ， 
9igpal(SIGALRM , handler). 
alarmin? 


pause() 





. 
h X 
== i- - — ee " 
| -— Fik 有 Sa risàgi 
[ EV. PS EIL + eel] ee Pe d s. "wi T 
ET 5 EE EL Tt | Ree Ee ea 
Td Sats 上 E Jr amer! x ER 
"TL m | rx Nu l "T rM Ui Ppr ^ H 
i Ea LP eee lal es d. 可 
| Es ETT pa ae at 


每 个 进程 有 自已 的 计时 器 





B7.7 一 个 进程 设置 一 个 限 钟 后 挂 起 


系统 调用 pause 挂 起 进程 直到 信号 到 达 。 任 何 信号 都 可 以 唤醒 进程 ,而 非 仅 仅 等 待 
SIGALRM。 以 上 想法 总 结 为 以 下 代码 . 


/* sleepl.c 
* purpose show how sleep works 


* usage sleepi 
* outline sets handler, sets alarm, pauses, then returns 
»/ 


B include <stdio.h> 
i include  «signal.h— 
// € detine SHHHH 


nain() 


| 
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void wakeup(int); 


printf( "about to sleep for 4 secondsXn") ; 
signal(SIGALRM, wakeup) ; ja catch it «/ 
alarm(4); | get clock »/ 
pause() ; '* Freeze here *, 
printf("Morning so soon? Xn"); j/a back to work =! 


) 


void wakeup( int signum) 
| 
# ifndef SHHHH 


printf( "Alarm received from kernel\n") ; 


4 endif 

) 

这 里 调用 signal 设置 SIGALRM 处 理 函 数 , 然 后 调用 alarm 设置 一 个 4 BRI TP RS ath dee 
后 调用 pause FfF- 


调用 pause 的 目的 是 挂 起 进程 直到 有 一 个 信号 被 处 理 。 当 计时 器 计时 4 OPW. AB 
送出 SIGALRM 给 进程 ,导致 控制 从 pause 跳 转 到 信号 处 理 函 数 。 在 信 叶 处 再 程 序 中 的 代码 
缸 执 行 , 然 后 控制 返回 。 当 信号 被 处 理 完 后 ,pause 返回 ,进程 继续 。 图 7.8 wii f pause 的 
执行 过 程 ， 






pause ( JE EE UR HI E Et 
RHEA aS pid: 


B] 7.8 进入 处 理 函 数 的 执行 流 


下 面 是 alarm 和 pause 2f $ : 


alarm 
目标 设置 发 送信 号 的 计时 器 
头 文件 8 include <—unistd. h> I ccc 
函数 原型 l ] unsigned old = alarm(unsigned seconds) 
$t seconds FiF AJETE CER) a 
] | | = TET 7 | 


Sn old 汁 时 器 剩余 时 间 
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alarm 设置 本 进程 的 计时 器 到 seconds 秒 后 激发 信和 号 。 当 设 定 的 时 间 过 去 之 后 ,内 核发 
i$ SIGALRM 到 这 个 进程 。 如 果 计 时 器 已 经 被 设置 ,alirm 返回 剩余 秒 数 (注意 ; 调用 alarm 
(CO) EE BK 33 XE LI] BP) 


pause 
HR 等 待 信号 本 
3k w f4 EE 8 include «C ünitstd. h 
gi e m uy | result = pause() 
参数 没有 参数 NE 
返回 什 es aros ee prc TET E 


pause 挂 起 调用 进程 直到 一 个 信号 到 达 。 如 昌 调 用 进程 被 这 个 信号 终止 ,pause RAK 
回 。 如 果 调 用 进程 用 一 个 处 理 阻 数 捕获 ,在 葵 制 从 处 理 函 数 处 返回 后 pause 返回 。 这 种 情况 
F errno 被 设置 为 EINTR，。 


7.5.3 调度 将 要 发 生 的 动作 


计时 髓 的 另 一 个 用 途 是 调度 一 个 在 将 来 的 某 个 时 刻 发 生 的 动作 同时 做 些 其 他 事情 。 调 
一 个 将 要 发 生 的 动作 很 简单 ,通过 调用 alarm 来 设置 计时 器 ,然后 继续 做 别 的 事情 。 当 计 
时 器 计时 到 0, 信号 发 送 ,处 理 函 数 被 调用 。 


7.6 时 钟 编程 2: 间隔 计时 器 


Unix 很 早 就 有 sleep 和 alarm。 它 们 所 提供 的 时 钟 精 度 为 秒 ,对 于 很 多 应 用 来 说 这 个 精 
度 基 不 能 让 人 满意 的 。 后 来 一 个 更 强大 和 使 用 广泛 的 计时 器 系统 被 添加 进来 。 这 个 新 的 系 
5t (& HF] — ^h ti PR 3 23 [6] FE TT EST 28 Cinterval timer) 的 概念 ,有 更 高 的 精度 。 而 且 每 个 进程 都 有 
3 个 独立 的 计时 顺 而 不 是 原 采 的 一 个 。 这 还 不 是 全 部 。 每 个 计时 器 都 有 两 个 设置 : 初始 间 
隔 和 重复 间隔 设置 。 新 的 系统 还 支持 alarm 和 sleep, 它们 对 大 多 数 应 用 来 说 已 经 足够 了 。 
图 7.9 是 它 的 一 个 相应 的 示意 图 . 






fy hy = ASP et a 


| 每 个 计时 盟 有 两 个 设置 ， 
到 第 一 个 信号 的 时 间 和 两 次 
信号 间 的 时 间 问 了 酌 


FCS: 虚拟 实用 
图 7.9 每 个 进程 有 3 个 计时 器 


可 以 用 这 个 新 的 系统 来 添加 时 延 和 为 事件 定时 。 
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7.6.1. 添加 精度 更 商 的 时 延 : usleep 

为 了 添加 精度 更 高 的 时 延 , 合 用 usleep: 

usieepin) 

usleep(n) 将 当前 进程 挂 起 ” 徽 秒 或 者 下 到 有 一 个 不 能 被 忽略 的 信号 到 达 ，。 
7.6.2 三 种 计时 器 : 真实 .进程 和 实用 


进程 可 以 以 3 种 方式 来 计时 。 考 虑 一 个 程序 在 运行 了 30 s 后 结束 .在 一 个 分 时 系统 
中 ,这 个 程序 不 是 一 直 在 运行 的 ,其 他 的 程序 与 它 共 享 处 理 器 。 FA 7. 10 显示 了 一 种 可 能 性 ， 
















2z... a... BH B B d 4d BN NH à b b B ^ »p | 4 T M M M UJ BM B b d 9 Y NH P 4 " ^ à b M - ^ & ^ M w* à 


Hero. 国定 
Sau cE — B i 
di, i meer Ge 


—— 


E 同 : 真实 30s MIs (APE KAIS AAEE) 


图 7.10 -时 间 用 在 哪里 


图 7. 10 显示 从 0 到 5s 进程 在 用 户 模 式 运 行 , 接着 从 5 到 15 s 睡眠 ,然后 在 核心 态 运 行 
到 20 s 睡眠 ,如 此 这 般 。 显 然 从 开始 到 结束 ,程序 使 用 了 10 s 的 用 户 时 间 、5 s 的 系统 时 间 。 
并 显示 了 3 种 时 间 : 真实 时 间 .用 户 时 间 和 用 户 时 间 十 系统 时 间 。 内 核 提供 计时 器 来 计量 这 
3 种 类 型 的 时 回 。3 类 计时 器 的 和 名 宇和 功能 如 下 : 

(1) ITIMER REAL 

xxr ibm SE TP ESE AT RI. [e] P E ipeo up. 也 就 是 说 不 管 程序 在 用 户 态 还 是 核心 
态 用 了 多 少 处 理 器 时 间 它 都 记录 。 当 这 个 计时 器 用 尽 ,发 送 SIGALRM A. 

(2) ITIMER VIRTUAL 

IX Tr i3 ce 3 (9 25 ARR PATE, FUR ERE YE HL AAO Ay. Hed 
iT BY 2S (virtual timer) ffl 30 s 比 实际 计时 器 (real timer) 的 30 8s 要 长 。 当 虚拟 计时 器 用 尽 , 发 
送 SIGVTALRM Ña., 

(3) ITIMER. PROF 

xx VERE SE CE Be TT HEP Su KER FR m B6 A BOD AS ET ITI. Sac} mf RE 
用 斥 .发 送 SIGPROF itj &. 


7.6.3 两 种 间隔 : 初始 和 午 复 


医生 给 你 一 些 药 丸 并 告诉 你 ;“ 过 一 个 小 时 吃 第 一 粒 , 然 后 每 隔 4 个 小 时 吃 一 粒 ," 你 需 
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要 设置 计时 器 到 1 POET AERA RGR ES 4 tet. She BATHS] S8 A Ux A ae 
有 这 样 两 个 参数 . WRN MBS ER. CE RTT BY ab FH AS SPA US H9) 88 FE f] RE it, value, 
重复 和 间隔 是 iintervat。 如 果 不 想 要 重复 这 一 特征 .将 it interval WE 0. BIL MW TAT HH 
Als H .u it value 为 0。 


7.6.4 用 间隔 计时 器 编程 


程序 中 使 用 alarm AE. RBA alarm 秒 数 就 可 以 了 。 程 序 中 使 用 间隔 计时 器 要 
复 休 一 点 ,要 选择 计时 器 的 类 型 ,然后 需要 选 摔 初 始 间 阳 和 重复 间隔 ,还 要 设置 在 struci 
itimerval 中 的 值 。 比 如 ,为 了 使 用 间隔 计时 器 来 提醒 你 坑 7.6.3 节 规定 的 计划 吃 药 , 设 
& nu value A 1 vp ait. ue @ it_interva] 为 4 小 时 .然后 将 这 个 结构 体 通 过 调用 setitimer f£ 
给 计时 器 。 为 了 读 取 计时 器 设置 ,使 用 getitimer, FE 7.11 是 系统 响应 的 示意 图 ， 





—— 


| struct itimerval 





57.1) EBHHAaAR 


1. 间 珊 计时 器 例子 :ticker demo. c 
程序 ticker_demo. c 演示 了 如 何 使 用 一 个 回 陋 计时 器 : 


/* ticker demo.c 
# demonstrates use of interval timer to generate requiar 
signals, which are in turn caughr and ased to count down 
x/ 


t include <stdio.h> 
£ include «<_gys/time, h> 
include -<signal. b> 


int maint j 
| 


void countdown( int): 


Signal(SIGALRM, countdown) ; 

if ( set_ticker(500) == -1) 
perror("set ticker"); 

else 
while( 1 ) 
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pause(); 


return 0; 


void countdown( int signum? 


à 
static int num = 10; 
printf("&d..", num-— ); 
fflusht stdout) ; 
if ( num « 0} 
printf("DONÉ! Xn"); 
exit(0)5; 


/* [from set ticker.c | 
* set ticker( number of milliseconds ) 
* arranges for interval timer to issue SIGALRMs at regular intervals 
* returns — 1 on error, 0 for ok 
x ard in milliseconds, converted into whole seconds and microseconds 
x note, set ticker(0) turns off ticker 


x? 


int set ticker( int n msecs ) 
1 
struct itimerval new timeset; 


long n sec, n usecs; 


n sec = n msecs / 1000 ; /* int part x/ 


[i 


n usecs = ( n msecs $ 1000) x 1000L ; /* remainder */ 


new timeset. it interval. tv sec = n sec; /*set reload */ 


| 


new timeset.it interval. tv_usec= n usecs; /*new ticker 


values; 
new timeset.it value.tv sec = n_sec; /*Sstore thisx/ 
new timeset.it value.tv usec = n nusSccs; /*and this» / 


return setitimer(ITIMER REAL, &new timeset, NULL); 


来 看 看 ticker demo. e 的 程序 流程 。--: 开 始 使 用 signal 设置 函数 countdown 3€ Ab Æ 
SIGALRM (i. 9A IET set ticker Ri BAER , 

set ticker 通过 装载 初始 间 随 和 重复 间 隅 设置 间隔 计 时 器 。 每 个 间 卫 是 由 两 个 值 组 成 
秒 数 和 微 秒 数 , 这 就 像 实 数 的 整数 部 分 和 小 数 部 分 。 计 时 器 开始 计时 ,控制 返回 到 maia. 
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回 到 main, ticker. demo. c 进入 一 个 无 尽 的 循环 .其 间 调 用 pause。 每 过 大 约 500 us, 控 
ibl BERE Z| countdown BAX, countdown 将 一 个 静态 变量 的 值 递减 ,打印 一 条 消息 , 通 贡 情 讽 
下 返回 调用 者 ， 当 恋 量 num 达到 0 时 、countdown 再 用 exit, 

当然 .main 不 是 一 定 要 调用 pause 的 。 主 程序 可 以 做 些 其 他 更 有 趣 的 事情 ,这 位 在 每 个 
预定 的 时 刻 还 是 会 跳 转 到 countdown 的 。 

间隔 计时 器 的 设置 是 通过 struct itimerval 来 完成 的 。 这 个 结构 类 型 包括 初始 间隔 和 重 
a), A SLE struct timeval 中 


struct itimerval 
{ 
struct timeval it value; /x time to next timer expiration»/ 
struck timeval it interval; /* reload it value with this x/ 
) 
struct timeval | 
Lime t tv sec /* seconds: / 
suseconds t tv usec; /* and microseconds*/ 


) 


不 同 的 Unix 版 本 ,struct timeval 的 细节 可 能 有 些 差异 。 查 一 下 你 的 系统 的 相应 手册 和 和 
头 文 件 。 

图 7.12 显示 了 结构 中 各 成 员 的 关系 ,图 ?7.13 显示 了 如 何 载 人 数据 以 使 第 一 次 计时 器 到 
达 时 间 为 60. 5 s, 然 后 每 240. 25 s 重复 一 次 。 


IER Apr rE "m nece] = 3: =p : me 
| ST Cy e ML PME shes P dit 
[pes ^ 


ITIMER REAL ITIMER. VIRTUAL ITIMER . PROF 














itvaue | [| j[|| ivaue [| "j| ivao [OT] 
itinterval | | ] || itineral[ [| Nineva | | 


struct iumerval struci timeval 
me SW TOWER. 剩 下 的 时 间 和 struct imevad 有 两 个 成 员 
重复 时 间 .这 两 个 设置 由 stmct timeval FR: PARER 


中 的 两 个 成 员 变 量 表示 


图 7.12 IRA iT ah PL 
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A ee Se a ATA e pe 
m -这 个 例子 中 将 记录 真实 时 间 
| il value | 6 | 500000 | | tal ALT AY A i By 60.5 s 


”后 传递 第 ~-- 人 人 信号， 然后 每 
en E | 250000 | | mà 240255 -aiat - 
| Dv sec — tv usec | 











图 7.13 mE 


2 系统 调用 小 结 


getitimer , setitimer 














目标 取得 或 设置 间 吧 计时 器 
头 文 件 É include  sys/time. h> 
函数 原型 result = getitimertint which, 


struct itimerval * val); 
result = setttimer(Cint which, 
const struct ttimerval * newval, 


struct iumerval * oldval) ; 


参数 which RRG E Agita 
val 向 当前 设置 值 的 指针 


newval 指向 要 被 设置 值 的 指针 
oldval 指 疝 被 替换 的 设置 值 的 指针 


18 [n] fi zu i 
0 成 功 


getitimer 将 某 个 特定 计时 器 的 当前 设置 读 到 val 指向 的 结构 中 。setitimer Hit At aie 
25 newval 指向 的 结构 的 值 。 和 如 果 oldval 不 指向 null, 之 前 计时 器 的 设 定 将 被 复制 到 
oldval 指 回 的 结构 中 。 

which 的 值 指定 将 要 被 读 或 更 新 的 计时 器 。 计 时 器 的 编码 分 别 是 ITIMER_ REAL, 
ITIMER VIRTUAL #1 ITIMER PROF, 


7.6.5 计算 机 有 几 个 时 钟 


如 何 才能 让 每 个 进程 有 3 个 独立 的 计时 器 ? 有 些 系统 同时 有 几 百 个 进程 在 运行 。 计 算 
JL EUH JL ELT RR SER ee? 不 ,一 个 系统 只 需要 一 个 时 钟 来 设置 节拍 。 这 就 像 用 一 个 节 
扣 器 来 为 一 个 弦 乐 四 重奏 乐团 定 折子 ,或 者 像 有 规律 摆动 的 钟 控 跑 动 一 个 上 古老 钟表 里 的 几 
根 指 针 。 一 个 硬件 时 钟 的 脉冲 是 计算 机 里 帷 ~- 需 要 的 时 钟 。 如 何 只 用 一 个 时 钟 在 设置 一 个 
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进程 的 私有 计时 器 为 5s 的 同时 又 设置 男 一 个 进程 的 私有 计时 器 为 12 s? 

一 个 古老 的 时 钟 是 如 何 让 时 壬 .分 针 儿 秒针 以 不 同 的 巡 度 转动 的 7 它们 的 答案 是 一 样 
的 。 每 个 进程 设置 自己 的 计数 时 间 ,操作 系 统 在 每 过 一 个 时 间 片 后 为 所 有 的 计数 器 的 数值 
做 递减 。 一 个 实际 的 例子 可 以 淞 清 这 些 概 念 ，。 

考虑 两 个 进程 : 进程 A 和 进程 BB。 进程 A 设置 它 的 真实 计时 器 (real timer) 为 5 s, 进 程 
B 设置 它 的 真实 计时 峰 为 12 s。 为 了 使 数字 看 起 来 简单 BYE A Sc PPS EE 100 下 。 当 进 
程 A 设置 它 的 时 钟 时 ,内 核 设 置 它 的 计数 器 为 500。 当 进程 B 设置 它 的 时 钟 时 ,内 核 设 置 它 
的 计数 器 为 1200, 如 图 7. 14 所 示 。 








每 个 进程 的 间 砚 计时 器 一 个 真实 的 时 钟 
每 个 进程 通过 调用 alarm 来 设置 它 的 权 有 计时 器 .内核 在 每 次 
收 到 时 钟 中 断 的 时 候 更 新 所 有 的 进程 计时 器 


图 7.14 两 个 计时 器 ,一 个 时 钟 


每 当 内 核 收 到 系统 时 钟 脉冲 , 它 壳 历 所 有 的 间隔 计时 器 ,使 每 个 计数 器 减 一 个 时 钟 单 
位 。 当 进程 A 的 计数 器 达到 0 的 时 候 , 意 味 着 已 经 有 500 时 钟 节拍 过 去 了 ,内 核发 送 
SIGALRM 给 进程 A。 如 果 进 程 A 已 经 设置 了 计时 器 的 it_intrerval 值 ,内核 将 这 个 值 复 制 到 
it value 计数 器 ,否则 内 核 就 关 掉 这 个 计时 器 。 

再 过 一 会 ,内 核 将 进程 B 的 计数 器 也 减 到 0, 相应 地 庙 进程 B 发 出 信号 。 如 果 B 设置 了 
FT BY at H E AR (BE (reload value). AA RW E it, value 为 相应 的 值 ,然后 继续 处 理 下 一 个 计 
DET 

通过 这 个 简单 的 机 制 , 每 个 进程 就 可 以 设置 自己 的 计时 器 。 这 个 计时 器 在 进程 睡眠 的 
时 候 也 在 倒计时 。 

其 他 的 珊 个 计时 器 如 何 工作 ? 它们 不 是 国定 的 倒计时 ,而 仅仅 在 进程 处 于 某 个 特定 状 
态 时 倒计时 。Linux 源 代 码 清 楚 地 给 出 了 它们 是 如 何 实现 的 。 


7.6.6 计时 器 小 结 


一 个 Unix 程序 用 计时 器 来 挂 起 执行 和 调度 将 变 采 取 的 动作 。 一 个 计时 器 是 内 核 的 一 
种 机 制 。 通 过 这 种 机 制 ,内 核 在 一 定 的 时 间 之 后 向 进程 发 送 SIGALRM, alarm 系统 调用 在 
特定 的 实际 秒 数 之 后 发 送 SIGALRM 给 进程 。setitimer 系统 调用 以 更 尚 的 精度 控制 计时 
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器 ,同时 能 够 以 固定 的 时 间 间 隔 发 送信 号。 
现在 已 经 知道 如 何在 程序 中 计时 了 。 要 实现 视频 游戏 还 需要 一 项 技术 : 管理 中 断 ， 


7.7 信号 处 理 1: 使 用 signal 


这 个 游戏 必须 处 理 中 断 。 可 能 当 用 户 按 下 一 个 键 的 时 候 程 序 正在 移动 一 幅 图 片 , 或 者 
在 处 理 一 个 用 户 输 入 的 时 候 , 计 时 器 发 来 一 个 信和 号。 如 果 游 戏 支持 双人 游戏 , 当 … 个 人 按键 
的 时 候 程序 可 能 正在 处 理 另 一 个 人 的 输 人 。 

中 断 处 理 是 操作 系统 和 系统 软件 的 关键 部 分 ，Uniz 中 的 软件 中 断 被 称 为 信号 
Csignals)。 现 在 需要 深入 理解 信号 处 理 。 作 为 开始 , 先 回 顾 一 下 早期 的 Unis fis hee 
型 ,然后 看 看 它 有 些 什 么 问题 ,最 后 再 学 习 POSIXQUnix 型 可 移植 操作 系统 接口 ) 的 信号 处 
HRE, 


7.7.1 星期 的 信号 处 理 机 制 


各 种 事件 促使 内 核 向 进程 发 送信 号 。 这 些 事件 包括 用 户 的 击 键 、. 进 程 的 非法 操作 和 计 
时 器 到 时 。 第 6 章 介绍 了 早期 的 信号 处 理 模 型 。 一 个 进程 调用 signal 在 以 下 3 种 处 理 信和 号 
的 方法 之 中 选择 : 

C1) 默认 操作 (一 般 是 终 赴 进程) ,比如 ,signal(SIGAILRM ,SIG_DFL) 

(2) ZB ÍS S.H u.signal SIGALRM,SIG IGN) 

(3) 调用 一 个 函数 ,比如 ,signal(SIGALRM handler) 


7.7.2 处 理 多 个 信号 


如 果 只 有 一 个 信号 要 处 理 , 原 始 的 信和 号 处 理 模型 足以 应 付 。 如 果 有 多 个 信和 号 到 达 会 发 
生 什 么 事情 ?如 果 响 应 定义 为 终止 (termination) 或 者 是 忽略 (ignore}) , 那 结 果 很 清楚 。 但 是 
如 时 是 调用 (invoke) 一 个 函数 来 响应 ,那么 结果 就 不 那么 明显 了 。 

l. 4H X ee Pl BB 

fa E XE X eR ARBRE. —MESRRETCRAR TEMS RAE HRA. 
当 信 号 或 老鼠 被 捕获 ,信号 处 理 函 数 或 捐 鼠 器 就 大 效 了 。 

在 早期 的 版 本 中 ,信号 处 理 函 数 在 另 一 个 方面 也 很 像 捕 鼠 器 : 在 每 次 捕获 之 后 ,都 必须 
重新 设置 它们 。 比 如 : 一 个 信号 处 理 函 数 可 能 如 下 : 


void handler(int s) 

1 
/*process is vulnerable heres / 
signal(SIGINT, handler}; ^ /xreset handlerx/ 
iei /*do work herex/ 


) 


Pe AURAL AE RPE. DUE RAE RE DEDERE REB SOS E, UE T AE 
AE URGE T . XE MESS B9 18] B 08 AR ET AE. 有 些 人 称 此 为 “不 可 靠 的 信 
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号 ” ge ig 4e t PI SERO BU EIA EES. 

2. 设计 一 个 更 好 的 杀 比 

捕 和 妃 器 问题 只 是 早期 信号 系统 的 一 个 界 点 。 为 了 能 党 明 问题 的 复杂 性 ,考虑 以 下 这 些 
实际 生活 中 的 问题 。 

3. 处 理 多 个 信号 

真实 直 界 充满 信号 ,也 就 是 意外 的 打扰 。 假 设 你 在 办 公 室 里 工作 。 电 话 可 能 会 响 , 串 能 
有 人 斋 门 ,或 者 火警 响起 。 对 于 这 些 事件 .可 以 忽 栈 ;也 可 以 处 理 。 处理 一 个 电话 意味 着 放 
下 当前 的 工作 , 拿 起 电话 ,与 打 电 话 的 人 交谈 , 桂 起 电话 ,然后 回去 做 放 在 一 边 的 工作 。 处 型 
BR C] A X AR FB (DL. 

RO FR 3E US FE VIS B BB BY eT SE RE MET 你 得 放下 电话 , 按 保 持 键 ,开门 ,和 来 访 
ACR AIR Esc Em. (Ebr dcm. ls Am HEERIdE. RANT A 
二 个 信号 打 斯 了 对 第 一 个 信号 的 处 理 。 

接 下 来 .正当 你 与 第 一 个 米 访 者 安 次 时 ;第 二 个 来 访 者 来 了 又 该 怎么 办 呢 ? —MBA 

下 ,第 一 个 人 会 挡住 门 、 这 们 第 二 个 人 就 得 等 你 与 第 一 个 人 交谈 完毕 。 当 你 与 第 一 个 人 交谈 
mi 这 种 情况 下 , 称 第 二 个 来 访 者 在 接待 第 一 个 来 访 者 结束 之 前 
i BE (blocked) . 

还 有 ,如 果 来 访 者 来 沪 的 时 候 你 正 专注 于 电话 那 头 讲话 怎么 办 ” 当 你 从 门口 回来 重新 
拿 起 电话 ,是 继续 刚才 的 话题 还 是 告诉 对 方 你 已 经 忘记 刚刚 说 到 哪儿 了 ? 

最 后 ， A ABE AER ACIE HUBER FRATRI T RE TARTE RRA? in Fe — PS RR 
一 样 重要 的 信号 达到 ,你 或 许 希 望 阻塞 其 他 信号 。 就 像 你 在 处 理 火 敬 时 不 会 管 电 笑 锥 是否 
Wa stu ARRA AGED AE. 4 Mem LS DE 没有 在 处 理事 件 也 不 想 被 其 他 事情 打扫 

4. 进程 的 多 个 信号 

进程 要 面 对 的 问题 和 你 次 面 对 的 没有 什么 太 大 不 同 。 想 象 一 个 进程 在 它 的 小 层 ( 内 存 ) 
里 工作 。 如 图 7.15 所 示 ， 用户 可 能 通过 按 下 Cul- C 来 产生 一 个 SIGINT 信号 ,或 者 是 
Ctr]~\ 产 生 SIGQUIT 信号 ,或 者 计时 器 到 时 产生 一 个 SIGQLRM 信号 。 就 像 电话 和 涡 门 的 
访 者 .所 有 这 些 信号 可 能 同时 到 达 、 在 Unix 系统 里 ,一 个 进程 如 何 响应 多 个 信息 ? 






SIGINT handler 
7 SIGQUIT handler 
T^ SIGALRM handler 


et 
EXAM. 
ipee 
n 


图 7.15 一 个 接收 到 多 个 消息 的 进深 


(1) 处 理 函 数 每 次 使 用 之 后 都 要 被 禁用 吗 ? CONS BU EDD 
(2) 如 果 SIG Y 消息 在 进程 处 理 SIGX 消息 时 .到 达 会 发 生 什 么 ? 
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(3) 如 果 进 程 还 在 处 理 前 一 个 SIGX 消息 时 ,第 二 个 SIGX 消息 又 到 来 会 发 生 什 么 ? 第 
三 个 又 到 了 呢 ? | 

(4) 如 果 消 息 到 来 时 ， 程 序 正 在 处 理 getchar 或 者 read 之 类 的 输 和 人 两 阻塞 , 那 会 旭 何 ? 

不 同 版 本 的 Unix 的 答案 各 不 相同 。 写 一 个 在 各 个 系统 下 都 能 正常 工作 的 程序 很 不 
容易 。 
7.7.3 测试 多 个 信号 


系统 是 如 何 回答 这 些 问题 的 ? 编译 并 运行 sigdemo3. c, 看 看 你 系统 中 的 进程 是 如 何 啊 
应 信号 组 合 的 : 


/* sigdemo3.c 
* purpose; show answers to signal questions 
* questionl; does the handler stay in effect after a signal arrives? 
* question2, what if a signal arrives while handling signalX"? 
* questiond: what if a signalX arrives while handling signalY? 
* questiond, what happens to read() when a signal arrives? 
xf 


# include <stdio.h> 
# include «simal. h> 


# define INPUTLEN 100 


main(int ac, char * av[ l) 

{ 
void inthandler(int)- 
void quithandler(int); 
char  input| INPUTLEN |; 


int nchars + 

signal( SIGINT, inthandler ) ， /* set handler x/ 
signal( SIGQUIT, quithandler ); /* set handler »/ 
da | 


printf("inType a message\n") ; 
nchars = read(0, input, CINPUTLEN~ 1)); 
if ( mchars == -1 } 
perror( "read returned an error"); 
else | 
input[nchars] = '\O'; 
| printf("You typed; *s", input); 


f 


while( strnemp( input , "quit", 4 ) 1= 0); 
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void inthandler(int 8) 


printf(" Received signal $d.. waiting\n", & 5; 
gleep(2) x 
príntf(" Leaving inthandler Xn"); 

} 


void quithandter(int s) 

| 
printf(" Received simal %d . waiting\n", 8); 
sieep(3): 
printf(" Leaving quithandler Xn"); 

) 


ix 27 VA AS [8] 68677 385 BL A AD T fii ^E AE Cul - C 和 Ctrl-\。 特 别 地 ,以 不 同 的 时 
延 , 试 试 以 下 组 合照 足 图 7.16 中 显示 的 函数 的 控制 流 。 

(CLEGG 

(20 ACCADE 

(3) hello'C Return 

(4) hello Return'C 

(5) "VXhello*C 





sR Ret. ee e uu TM 
| .- LR readiO;huf.lenj; |^ 





main Joop 一 一 










“Chandicr 一 -一 
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图 7.16 SR EnA EE RC) ES fen] Dt 


这 些 试 验 的 结果 显示 了 你 的 系统 是 如 何 处 理 信号 组 合 的 。 

1 BY dk 6942 3 HRS) 

如 果 两 个 SIGINTS 信号 杀 死 了 进程 ,那么 意味 着 你 的 系统 是 不 可 靠 的 信号 ; AEE RY 
必须 每 次 都 重 嫩 。 如 果 多 个 SIGINTS 信号 没有 杀 死 进程 ,意味 着 处 理 隧 数 在 被 调用 后 还 起 
作用 。 现 代 信 号 处 理 机 制 允 许 你 在 两 者 之 间 做 出 选择 。 

2. SIGY 打 断 SIGX 的 处 理 函 孝 ( 接 电话 的 时 候 有 人 鼓 门 ) 

当 接 连 按 下 Ctrl-C 和 Cirl-\ 会 看 到 程序 先 跳 到 inthandler ,接着 跳 到 quithandler, RG 
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HEA inthandler; 最 后 回 到 主 循环. 你 的 试验 结果 是 如 何 的 ? 

3. SIGX 打 断 SIGX $5 4E 8 E d CE RAR? 

x RI TEE UC PII AR al). T3 3 BPSD PRAT HE : 

(1) 3894 AA) — 1 EXE S CI: 

(2) 忽略 第 二 个 信号, 这 各 没有 呼叫 等 待 功能 的 电话 机 类 亿 ; 

(3) 阳 塞 第 二 个 信号 直到 第 一 个 处 理 完毕 。 

原来 的 信号 处 理 系 统 使 用 方法 (1), 人 允许 递归 调用 。: -个 轩 安 全 的 选择 是 方法 (3)。 就 
像 第 二 个 人 来 斌 门 ;第 二 个 信号 被 阻塞 而 不 是 忽略 ,上 自 到 第 -- 个 信和 与 饮 处 理 完 。 你 的 系统 阻 
塞 第 一 个 信号 吗 ? 述 是 递归 调用 姓 理 尔 数 ? 你 的 系统 将 多 个 信号 排队 吗 ? 

4. 被 中 断 的 系统 调用 { 接 电 话 的 时 候 有 人 项 门 ) 

这 种 情况 经常 发 生 。 程 序 经 常 在 等 待 输入 的 时 候 接 收 到 信号 。 在 E 面 邦 个 测试 程序 
中 , 主 循 环 阳 塞 以 等 待 键盘 的 输入 (read JAAN). Hii AP Br Ctrl-C ai h (Ctrl —\) 
HF Dae SI fei Ab RE os 2C = b ES pR BM eb EE od n e ERE E) 9] E YI. pz VR In] BE PTS fi EE. 
(AR A abs? 如 果 输 入 “hel”, 接 着 按 下 Ctrl - C ARI BESE SES A "lo" rRIR] SE ze nu] We? 程 
序 看 到 的 是 完整 的 “hello* 还 是 只 有 “lo”? 程序 是 重新 开始 read 还 是 从 read 38 Bl [BTE ZZ E 
errno 到 EINTR? 

是 重新 开始 还 是 返回 呢 ?” 在 ATST BU Unix 中 是 返回 并 设置 EINTR 为 一 1( 经 典 模 
A) MÆ UCB 中 会 自动 的 重新 开始 ， 


7.7.4  4& S WLA XE fi B3 39 za 


TRIS fa S RRELATA. 

d. 不 知道 信号 被 发 送 的 原因 

信号 处 理 卫 数 是 一 个 在 信号 到 达 的 时 候 被 调用 的 隔 数 。 内 核 传 给 处 理 图 数 一 个 信号 数 
字 编 号 。 在 sigdemo3. c HAX inthandler 被 调用 时 得 到 一 个 值 为 SIGINT 的 实 参 。 将 信号 
编号 作为 参数 传 给 处 理 函 数 使 一 个 函数 可 以 处 理 多 个 信号。 比如 ;在 sigdemo3. c 中 可 以 用 
一 个 处 理 函 数 替代 原来 的 两 个 处 理 晒 数 , 根 据 人 参数 来 决定 打印 什么 。 

蛙 期 的 模型 只 告诉 处 理 哨 数 它 性 调用 是 由 什么 类 型 的 傅 号 而 引起 的 ,但 是 没有 告 之 为 
什么 会 生成 信号 。 比 如 , 几 种 算术 错 肖 会 引起 浮 点 异 涡 (floating 一 point exception)。 比 如 除 
SAS Bio nhs Ss Pit. DRS E ae. 

2， 处 理 函 数 中 不 能 安全 地 阻塞 其 他 消息 

啊 应 一 个 火警 时 ,一 般 情 况 下 会 忽略 电话 铃声 。 假 设想 让 程序 在 响应 SIGINT 时 忽 咯 
SIGQUIT。 使 用 经 典 信 号 机 制 收 改 inthandler, 如 下 所 示 : 


void inthandler(int s) 
i 
int rv; 


void ( * prev ghandler}() - /*holds prev handlers; 


D dE AO. Dl AE R A E R A A A EO. BSURIS$ e$ da. 
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prev qhandier = signal(SIGQUIT,SIG IGN); 
/*ignore QUIT ss, 


sijnal(S1GQUIT,prev qhandler); /xrestore handlers; 


1 
f 


这 样 YE ME A rp IBY Ah 98 oS RCM EE AAG ih AP EE RC LE ZR EE REE. RA 
两 个 问题 。 第 一 在 调 用 inthandler 和 调用 signal 之 间 是 它 的 软肋 所 在 。 这 里 只 是 希望 调用 
inthandler 和 忽略 SIGQUIT 局 时 进行 。 第 二 ,这 里 并 不 想 乱 略 SIGQUIT ,而 只 是 想 阻 敌 它 
直到 inthandler 处 理 完成 ,如 同 想 在 火警 之 后 再 回来 接 电话 。 在 处 理 完 关键 事件 后 ,还 是 很 
高 兴 看 到 SIGQUIT HE THE. 


7.8 信号 处 理 2: sigaction 


在 过 去 的 几 年 中 ,和 针对 原来 的 模型 所 产生 的 问题 ,各 种 相关 组 织 开发 出 了 一 些 不 同 的 解 
决 方案 。 这 里 将 只 学 习 POSIX 模型 和 相关 的 系统 调用 。 经 典 的 信号 系统 依旧 被 支持 ;而且 
在 一 些 应 用 中 这 些 就 九 了 。 


7.8.1 处 理 多 个 信号 : sigaction 


É POSIX 中 用 sigaction #4 signal, BRAM. eT ASH Re Ae. ON 
RRE IDA BI T fem ERAT BO EL. 


int sigaction(signalnumher, action, prevaction) 


这 个 函数 的 概要 如 下 ， 
sigaction 
目标 指定 - -个 信号 的 处 理子 数 
头 文件 + include «signal, h=> 
函数 原型 res =sigaction(imt signum, 


const struct sigaction * action, 


struct sigaction * prevaction) ; 


参数 signum 要 处 理 的 信号 
action 指针 ,指向 描述 操作 的 结构 
prevaction ”指针 ,指向 描述 被 蔡 换 操作 的 结构 
15 [9 fi =4 失败 
| 0 成 功 


第 一 个 参数 signum 指明 想 要 处 理 的 消息 . 第 二 个 参数 action 指向 描述 如 何 响 应 信号 
结构 体 。 第 三 个 参数 prevaction 如 果木 是 null 的 话 ,就 是 指向 描述 被 替换 的 处 理 设置 的 结 
FPE. WIS Be Fe ETE RUN SR (d 0, 省 则 返回--1。 
l. 定制 信号 处 理 ， struct sigaction 
在 过 去 ,和 面 对 信号 的 处 理 只 有 简单 的 几 种 选择 ,SIG_DFL SIG_IGN 或 者 函数 姓 理 。 这 
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些 选 项 在 新 的 系统 中 作为 结构 体 sigaction 的 部 分 定义 依然 提供 。 结 枸 体 sigaction 定义 了 如 
何 处 理 一 个 信和 号 。 以 下 是 这 个 结构 体 的 完整 定义 : 


struct sigactioni 
/* gc only one of these two x/ 
void ( + sa, handler)(); /*SIG DFL,SIG IGN,or function */ 


void (* sa sigackion)(int,siginfo Lb * ,void * 2; /* new handler x/ 


sigset t sa mask; /* signals to block while handling */ 
int sa flags; /* enable various behaviors «/ 


l 
J 


C1) 选择 sa handler 还 是 sa. sigaction? 

首先 ,要 在 老 的 信号 处 理 方 式 和 新 的 更 强大 的 信号 处 理 方式 之 间作 出 选择 。 如 果 老 的 
处 理 方式 ( 即 SIG. DFL,SIG. IGN 或 者 处 理 函 数 ) 了 就 够 用 了 ,那么 可 以 设置 sa handler 为 其 
中 之 一 。 当 然 ; 如 果 指 定 为 旧 的 信号 处 理 方 式 ,那么 只 能 得 到 信号 编号 。 否则 ,如 果 设 定 sa_ 
sigaction 为 一 个 处 理 明 数 , 那 么 那个 处 理 函 数 被 调用 的 时 候 , 不 但 可 以 得 到 信号 编号 而 且 可 
以 获悉 窗 调 用 的 原因 以 及 产生 问题 的 上 下 文 的 相关 人 信息。 两 者 之 间 的 差异 总 结 如 下 。 


使 用 则 的 处 理 机 制 : 使 用 新 的 处 理 机 制 : 
struct sigaction action; action. sa_handler = handler old; 
struct sigaction action; action. sa_Sigaction = handler new; 


Anf 4 V A EX OR A BS SD 很 简单 ,只 需 设 置 sa_jlags 的 SA_ 
SIGINFO 位 。 

(2) sa flags 

然后 DE AP PR pECRCRE n fer XE BE E de E B0 4 I8) RE. sa flags 是 用 一 些 位 来 控制 处 理 
p a0 fep pk 4 个 问题 的 。 相 关 的 细节 可 以 在 手册 上 查 色 。 下面 是 部 分 列表 。 


标 记 含 x 
SA RESETHAND 当 处 理 晒 数 被 调用 时 重 置 。 dO IEGE FH dE BUSES 1O 
SA_NUDEFER 三 处 理 信 号 时 关闭 信号 自动 阻塞 ,这样 就 完 许 递归 调用 信号 处 理 
PR S 
SA RESTART 当 系 统 调用 是 针对 一 些 慢 速 的 设备 或 类 做 的 系统 调用 ,重新 开始 ,而 
不 是 返回 。 这 样 是 采用 BSD 模式 
SA SIGINFO 指明 使 用 sa sigaction 83 SEES PR Ai. Rx T fv TUB CREE LES 


4 SEiBF sa handler f& je] E AB JE RS AOA. LR sa sigaction B iB FH. 
传 给 钼 理 函 数 将 不 只 是 信号 编号 ,还 包括 指向 描述 信号 产生 的 原因 和 
Fe £F RS ES HS UE 


(3) sa mask 
最 后 ,决定 在 处 理 一 个 消息 时 是 否 要 阻塞 其 他 信号 。sa_mask 中 的 位 指定 哪些 信号 要 被 
HÆ. EH sa_mask, 可 以 在 逃离 火灾 现场 时 阻塞 电话 呼 央 和 来 访 者 。sa_mask 的 值 包括 要 
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2. 例子; 使 用 sigaction — 
下 面 的 例子 演示 了 如 何 使 用 sigaction (注意 程序 如 和 何 做 到 在 处 理 SIGINT 时 阻塞 


SIGQUIT 的 ) 


/* sigactdemo.c 


* purpose, shows use of sigaction() 

x feature : blocks ~\ while handling C 

x does not reset ^C handler, so two kill 
+ 


+ include «< stdio. h> 
# include «signal, h> 
H define INFUTLEN 100 


maint ) 

i 
struct sigaction newhandler: /* new settings x/ 
sigset t blocked; /* set of blocked sigs «/ 
void inthandler(); /* the handler x/ 
char x[ INPUTLEN | ; 


/* load these two members first x/ 
newhandler.sa handler = inthandler; 

/* handler function «/ 
newhandler.sa flags = SA RESETHAND | SA RESTART. 


/* options */ 


/* then build the list of blocked signals x/ 


sigemptyset(&blocked): /* clear ali bits */ 
sigaddset(&blocked, SIGQUIT) ; /* add SIGQUIT to list «/ 
newhandler.sa mask = blocked; /* store blockmask »/ 
if ( sigaction(SIGINT, &newhandler, NULL) == -1) 
perror("sigaction"). 
else 
while( 1 j/! 


fgets(x, INPUTLEN, stdin); 
printf( "input: $&s", x); 


| 


void inbhandler(int 5) 


1 
printf("Called with signal * din", s}; 
sleep(s); 
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printf("done handling signal * d\n", 8); 
j 


试 善 运行 这 个 程序 。 如果 以 很 快 的 速度 连续 按 Ctrl-C 和 Ctrl-\ ,退出 信号 将 被 阻塞 下 
到 中 断 信 民 处 埋 完 毕 。 如 果 连 续 按 两 下 Ctrl - 避 , 进 程 就 将 被 第 一 个 信号 杀 死 。 如 果 想 要 捕 
获 所 有 的 Ctrl-C, 将 SA RESETHAND #3 M sa flags PRA. 


7,8.2 4 Sa 


— 4r t f nT 8E Bl A RRS Pi. fa S RI RETETE far B] f ELTE fe] BGA. signal 
Pe fle 7 —B Eq EACH RIE & Sb LH, POSIX ££ HG .Bl sigaction {H T A Zr . 8H d 
定义 的 方法 来 控制 进程 如 何 对 各 和 神 信 号 组 合 做 出 反应 。 

现在 已 经 知道 如 何在 程序 中 管理 时 间 和 和 中断。 视频 游戏 还 需要 最 后 一 项 技术; 防止 
HEEL o 


7.9 | 防止 数据 损毁 (Data Corruption) 


你 有 曾经 被 同时 做 区 件 事情 摘 得 萤 头 转向 并 因此 犯 铺 旋 的 经 历 吗 ? SUERTE TE TR SEX 
邮票 的 时 候 响 起 ,你 可 能 会 寄 出 一 封 设 有 贴 邮票 的 人。 程序 也 有 同样 的 问题 。 当 它们 正在 
处 理 一 件 事情 时 被 出 用 到 其 他 志方 ,它们 就 可 能 会 被 搞 芝 以 至 于 把 事情 弄 得 一 所 精 。 

来 看 看 在 现实 生活 中 中 断 是 记 何 引起 数据 铅 误 的 。 然 后 党 习 在 程序 中 如 和 何 防止 这 种 情 
BA. 


7.9.1 数据 损毁 的 例子 


继续 那个 办 会 室 的 例子 。 敲 你 办 公 室 门 的 人 要 把 他 的 和 名字 和 地 址 所 到 一 个 列表 里 。 每 
个 人 只 在 列表 的 最 后 添加 一 项 记录 : 姓名 .街道 .城市 .省份 和 邮编 。 考 虑 以 下 两 个 问题 . 

第 一 , 当 -- 个 人 正在 往 列表 里 写 信 息 时 有 人 打 电 话 来 要 列表 里 的 名 字 和 地 址 。 如 果 你 
将 列表 的 信息 读 给 人 家 ,就 会 有 给 出 不 完整 信息 的 可 能 。 这 可 以 通过 在 受 访 时 挂 挤 电话 来 
阻止 这 类 错误 的 发 生 。 

第 二 ,考虑 一 个 不 同 的 问题 。 当 一 个 访问 者 刚刚 把 姓名 填 好 ,第 二 个 SIGKNOCK 信和 号 
到 达 。 如 果 人 允许 递归 的 信和 号 处 理 , 第 一 个 访 者 要 等 第 二 个 访 者 填 好 他 的 信息 后 再 继续 在 列 
表 的 末尾 填 自 己 余 下 的 信息 。 这 样 列 表 就 包含 了 错误 的 数据 ; -条 记录 在 另外 一 条 记录 中 
间 。 这 可 以 通过 一 个 接 一 个 而 不 是 递归 的 接 符 访 者 来 防止 这 类 错误 ， 

这 两 个 例子 说 明了 在 一 些 情况 下 一 个 操作 不 应 该 被 其 他 操作 打 断 。 在 对 一 个 数据 结构 
(这 里 是 列表 ) 改 动 结 束 之 前 ,其 他 函数 不 能 读 或 写 这 个 数据 结构 。 当 然 , 处 理 像 火警 一 类 的 
信和 号 是 安全 的 ,因为 这 类 处 理 并 不 读 或 修改 数据 ， 


7.9.2 临界 区 {Critical Sections) 
一 段 修 改 一 个 数据 结构 的 代码 如 果 在 运行 时 被 打 断 将 导致 数据 的 不 完整 或 损毁 , 则 称 
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这 有 段 代 码 为 临界 区 。 当 程序 处 理 信号 时 ， 必须 决定 哪 一 段 代码 为 临界 区 ,然后 设法 保护 这 自 
代码 。 临 界 区 不 一 定 就 在 信号 处 理沙 数 中 ,很 多 出 现在 常规 的 程序 流 中 。 保 护 临 界 区 的 最 
简单 的 办 法 就 是 阻塞 或 乱 略 那些 寻 理 症 数 将 要 使 用 或 修改 特定 数据 的 信号 。 


7.9.3 阻塞 信号 : sigprocmask 和 sigsetops 


可 以 存 信 号 姓 理 者 一 级 或 进程 一 级 阻塞 信 往 。 

l. 在 信和 号 处 理 者 一 级 阻塞 信号 

为 了 在 处 理 一 个 信号 的 时 候 阻 塞 男 一 个 信号 ,要 设置 struct sigaction 结构 中 的 sa_mask 
MA, ER BAe RAAT EE TBA sigaction, sa_mask 是 sigset t 类 型 , 它 定 六 本 一 个 
信号 集 。 我 们 将 简要 地 解释 这 个 集合 。 

2, 一 个 进程 的 阻塞 信号 

在 任何 时 候 一 个 进程 都 有 一 些 傅 号 被 阻塞 。 注 意 , 是 阻塞 而 不 是 忽略 。 这 个 信号 集 就 
称 为 信号 挡 板 (signal mask), JE rf sigprocmask 可 以 修改 这 个 被 阻塞 的 信号 集 ， 
sigproemask 作为 一 个 原子 操作 根据 所 给 的 信号 集 来 修改 当前 被 阻塞 的 依 号 集 ， 


sigprocmask 
目标 修改 当前 的 信号 挡 板 
Xx | # include «signal. h> 


By ey Je A int res = sigprocmask( int how, 
| const sigset t * sigs, 


sigsef t * prev); 


参数 how SiR in Sik 
sigs ”指向 使 用 的 信号 列表 的 指针 
prev ”指向 之 前 的 信号 挡 板 列表 的 指针 (或 为 null 
一 1 EZB 
y& El tÈ 3 成 功 
sigprocmask 修改 当前 的 信号 挡 板 设置 。 当 how 的 值 分 别 为 SIG_BLOCK SIG . 
UNBLOCK ak SIG_SET Et, * sigs 所 指定 的 信号 将 被 添加 ,删除 或 替换 。 如 果 prev KE 
null, 那么 之 前 的 信号 挡 板 设置 将 被 复制 到 * prev 中 。 
3， 用 sigsetops 43642 5-3 
一 个 sigset t 是 一 个 抽象 的 信号 集 ,时 以 通过 一 些 范 数 来 尝 加 或 删除 信号 。 基 本 的 函数 
如 下 : 


&igemptyset(sigset t x setp) 


TW BR Hi setp 指向 的 列表 中 的 所 有 信和 号。 


sigfillset(sigset t * setp) 
添加 所 有 的 信号 到 setp jë Ta B9 9] 3 


sigaddset(sigset t x setp, int siqnum) 


ee ' - OU ee 
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添加 signum £l setp 指向 的 列表 。 


sigdelset(sigset_t * setp, int signum) 


从 setp 指向 的 列表 中 删除 signum 所 标识 的 信号 。 


4, 例子 ; Hop Hea A Pte 
FE FRY EA RAAB A a OR et ae BBE SIGINT 和 SIGQUIT fi 5: 


sigset t sigs,prevsius; /* define two signal sets */ 
sigemptyset(&sigs); /* turn off all bits */ 
sigaddset(&sigs, SIGINT); /* turn on SIGINT bit x/ 
sigaddset(&sigs, SIGQUIT) ; /* turn on SIGQUIT bit «/ 


sigprocmask(SIG BLOCK, &sigs, &prevsigs); /* add that to proc mask */ 
// .. modify data structure bere.. 


sigprocmask(SIG SET, x prevsigs, NULL); /* restore previous mask */ 


注意 这 里 是 如 何在 修改 一 个 tey SR s uk C PETER YR TT BE fe RP TC BU P RC s AUG: FB DR 
存 的 设置 来 恢复 原来 的 信号 挡 板 。 除 非 目 的 就 是 修改 获取 的 资源 ,否则 释放 资源 时 恢复 获 
取 时 的 状态 是 个 好 习惯 ， 


7.9.4 重 入 代码 (Reentrant Code): 递归 调用 的 危险 


打 断 别人 登记 ,而 将 自己 的 名 字 和 和 地址 捅 在 别人 的 记录 中 间 的 例子 引信 另 一 个 与 数据 
损毁 有 关 的 概念 ; 可 重 人 函数 ， 

一 个 信和 与 处理 者 或 者 一 个 蚂 数 ,如 果 在 激活 状态 目 能 被 调 几 而 不 引起 任何 问题 就 称 之 
为 可 重 和 的。 

在 通过 sigaction 设置 时 ,可 以 通过 设置 SA_ NODEFER 人 记 来 多 洗 处 理 函 数 的 递归 调用 。 
反之 ,可 以 通过 清除 此 位 来 阻 寒 信 和 号。 和 如何 选择 呢 ? | 

AL SERRE UR ERI EAR. PR SER. (MRRP ERS UA HI REIS. f 
号 不 像 电话 便条 那样 贴 在 那里 等 你 回 米 处 理 。 有 些 信 号 是 非常 重要 的 : 丢掉 一 些 是 安全 
的 吗 ? 

是 丢掉 信号 还 是 形 乱 数据 ”哪个 更 糟 些 ” 有 没有 办 法 同时 避免 这 两 个 问题 ? 设计 使 用 
信和 导 的 程序 时 ,这 些 是 必须 考虑 的 问题 。 信 号 处 理 小 的 错误 秽 象 不 很 有 规律 ,尤其 在 系统 处 
于 高 负载 的 情况 下 或 者 在 精确 的 性 能 计量 的 时 候 。 排 错 带 要 理解 信号 外 理 的 工作 机 理 , 还 
要 知道 哪里 可 能 会 有 问题 。 


7.9.5 视频 游戏 中 的 临界 区 
匀速 在 屏幕 上 移动 , 碰 到 墙 或 挡 板 就 弹 回 。 用 户 和 通过 按键 上 下 移动 挡 板 。 间 隔 计数 
器 控制 球 的 运动 。 用 户 控 制 挡 板 的 输入 就 如 信号 卷 祥 看 上 太 蚌 无 法 项 料 的 事件 。 需 要 在 某 


RY 28 BH EAS? 有 没有 什么 临界 区 ,其 问 挡 板 不 应 该 移动 吗 ? 在 应 用 所 有 已 学 的 
知识 来 完成 视频 游戏 之 前 , 先 来 看 看 男 -- 个 信号 的 来 源 : 其 他 进程 。 
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7.10 kill: 从 另 一 个 进程 发 送 的 信号 


信号 来 自 间隔 计时 器 .终端 驱动 .内 核 或 者 进程 。 一 个 进程 可 以 通过 kill 3& 5698 A 
一 个 进程 发 送信 和 号: 





kill 

His 向 一 个 进程 发 送 一 个 信号 
头 文件 # include < sys/types, h> 

# include — signal. h> 

i 函数 原型 inthill(pid.rpid, insi — i ststs—~S 

"Y & ae 日 "ERE id M 

Sig 要 被 发 送 的 信号 
返回 值 | 失败 


0 成 功 


kill 向 一 个 进程 发 送 一 个 信和 号。 发 送信 号 的 进程 的 用 户 ID 必须 和 目标 进程 的 用 户 ID 
相同 ,或 者 发 送信 号 的 进程 的 拥有 者 是 一 个 超级 用 户 。 一 个 进程 可 以 向 自己 发 送信 号 。 

一 个 进程 可 以 向 其 他 进程 发 送 任何 信息 ,包括 一 般 来 目 键盘 . 回 隔 计 时 器 或 者 内 核 的 信 
号 。 比 如 一 个 进程 可 以 向 男 一 个 进程 发 送 SIGSEGV 信号 ,就 好 像 目 标 进 程 执行 了 非法 内 存 
ER. 

Unix 命令 kill 使 用 kill 系统 调用 (如 图 7. 17 Bra). 





7.17 一 个 进程 第 用 MOR REAR 


D. HEAL up 1h 45 65-3 50 

接受 信和 号 的 进程 几乎 可 以 设置 任何 信号 的 处 理 者 。 考 虑 一 下 在 收 到 SIGINT 时 就 打印 
OUCH! 的 程序 。 如 果 其 他 进程 向 OUCHI1 程序 发 送 SIGINT 又 该 如 何 呢 7 OUCH! 程序 
会 捕获 信号 , 跳 转 到 处 理 者 ,打印 OUCH! (如 图 7. 18 R). 

更 进一步 。 如 果 第 一 个 程序 设置 一 个 间隔 计时 器 ,计时 器 的 信和 号 处 理 防 数 向 OUCH! 
程序 发 送 SIGINT 信号。 这样 相应 的 处 理沙 数 就 被 调用 。 从 而 一 个 进程 的 计时 器 控制 了 另 
一 个 进程 的 函数 调用 实际 上 ,一 组 进程 可 以 像 橄 榴 球 运动 员 传 递 梧 检 球 那样 传递 信号 。 
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图 7.18 fe Sek AE 


2. IPC 信号 设计 ; SIGUSRI,SIGUSR2 

Unix 有 两 个 信号 可 以 被 用 户 程 序 使 用 ， 它 们 是 SIGUSRI 和 和 SIGUSR2。 这 两 个 信号 疫 
有 预定 义 任务 。 可 以 使 用 它们 以 避免 使 用 已 经 有 预定 义 语义 的 信号 ，。 

将 在 后 面 几 章 学 习 进 程 喇 通信 。 编 程 时 可 以 有 很 多 方法 组 合 使 用 kil 和 sigaction。 


7.11 使 用 计时 贤 和 信和 号: d LL 
现在 回 到 视频 游戏 ， 游戏 有 两 个 主要 元 素 : 动画 和 用 户 输 和 人。 劲 画 奚 平滑 ,用 户 答 人 会 
改变 运动 状态 。 下 一 个 程序 bounceld.c 让 用 户 可 以 将 字符 囊 在 屏幕 上 弹 来 弹 去 ， 
7.11.1 bounceld.c: 在 一 条 线 上 控制 动画 


， ”首先 来 看 看 bounceld 看 上 去 是 什么 样子 。 界 面 如 图 7.19 PAR. bounceld. c 将 一 个 单 
词 平 滑 地 在 屏幕 上 移动 。 当 用 户 按 下 空格 键 ,单词 就 向 反方 癌 移动 。“s" 键 和 “[" 键 分 别 增加 
和 减少 单词 的 移动 速度 。 按 “Q" 键 退出 程序 ， 


Minia ee a ee ld dt 
Ii RERO um a 5. 9o 9 [uM 
DUTIES ami Deal Pes ei a 
x = | m 一 一 一 一 一 -一 一 一 一 一 一 一 一 -一 一 一 一 一 一 -- 





NF | me 





减速 加 速 
7.19 bounceld Mint Ath: 用 户 控 制 的 动画 

这 个 程序 是 如 何 闫 现 的 呢 ? ROCA ORM. 在 一 个 地 方 画 一 个 字符 串 ， 

等 几 音 秒 , 然 后 擦 去 旧 的 影像 并 在 原来 位 置 的 左边 或 右边 一 个 单位 距离 重 靳 画 同一 个 字符 


A) vb X8 e BK 
两 个 变量 分 别 记 录 移 动 的 方向 和 速度 。 设置 方向 变量 的 值 为 十 1 和 一 】 分 别 表示 向 左 
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fumpta. unpdEdpc GTP SS SI Ke ng. Erde n9 utu] sk ok 36 RHEE E 
则 意味 着 较 快 的 速度 。 

现在 向 程序 添加 方向 和 速度 控制 。 根 据 用 户 的 键盘 输入 修改 方向 和 速度 变量 。 程 序 的 
逻辑 如 图 7. 20 所 示 。bounceld 体现 了 两 个 重要 的 技术 ; 状态 变量 和 事件 处 理 。 记 录 位 置 、 
方向 和 延 时 的 变量 定义 了 动画 的 状态 。 用 户 输入 和 计时 器 信号 是 改变 这 些 状 态 的 事件 。 每 
次 计时 器 到 达 信 和 号 就 调用 改变 位 置 的 处 理 函 数 。 每 次 得 到 用 户 键 盘 输 入 信号 就 调用 改变 方 
向 和 速度 变量 的 代码 。 以 下 是 它 的 代码 。 


流 到 信号 处 理 
SER See 状态 变量 


rs rie Ti ~ mr = M se j rol air " 
. 4 * T 2 UI A. [ ] 
"get I I... on tickor() 



















E] 7.20 用 户 输 和 人 改变 变量 值 而 变量 值 控制 动作 


/* bounceld.c 
* purpose animation with user controlled speed and direction 
* pote the handler does the animation 
x the main program reads keyboard input 
> compi:e cc bounceld.c set ticker.c -l curses - o bounceld 


a 
H#aunc.ude <stdio.h> 
H include <curses. h> 


# include «signal. h> 
/* some global settings main and the handler use »/ 


H define MESSAGE "hello" 
H define BLANK " 5 


int row;  /* current row */ 


int col; /# current column -*' 


int dir; /« where we are going */ 
int maces 
! 
1 
int delay; | bigger =~: s"ower «/ 


int ndelay; . * new delay =, 
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——À — —Á r——— - 





int C; /* user input x/ 


void move msg(int); /* handler for timer */ 


initscr(): 


crmode(); 

noecho(); 

clear(): 

row = 10; /* start here +/ 

col = 0; 

dir = i; /* add 1 to row number x / 
delay = 200; /* 200ms = 0.2 seconds «/ 
moveirow,col); /* get into position x/ 
addstr( MESSAGE) > /* draw message +/ 


signal(SIGALRM, move msg ) ， 
set ticker( delay }; 


whiletl) 
{ 
ndelay = 0; 
c = getch(); 
if {c =a 'Q') break; 
if te == '*)dir = -dir; 
if {e == If! fh delay > 2) ndelay = delay/2; 


if (c == 's' ) ndelay = delay x 2 ; 
if ( ndelay = 0) 
set ticker( delay = ndelay ); 
i 
endwin(): 


return 0; 


void move msgt int signum) 

1 
Signal(SIGALRM, move msg); /x reset, just in case x/ 
move( row, col ) ; 
addstr( BLANK ); 


col 十 = dir; /* move to new column */ 
movel row, col 5; /* then set cursor x/ 
addstr( MESSAGE ). /* redo message x 
refresh(); /* and show it */ 
fx 

* now handle borders 

xf 


if ( dir == -1&&col <= 0) 
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Gir: = Au 
else if ( dir == 1 && col + strlen( MESSAGE) >= COLS ) 
dir = -1; 


} 


1 d gai ARX. 一 个 真实 的 例子 

在 学 习 信 号 处 理 函 数 的 数据 损 席 时 查 到 过 重 人 函数 ，bouneeld 提供 了 一 个 考察 这 个 问 
题 的 真实 例子 。 开 始 时 信号 处 理 函 数 move msg 每 秒 钟 被 调用 OK. TRU BEER] at S 
延 时 以 增加 动画 速度 。 如 果 按 很 多 次 "f” 键 ,两 次 计时 器 消息 之 间 的 间 隐 可 能 比 一 次 处 理 隐 
数 的 执行 时 间 还 要 短 。 如 果 计 人 时 器 消息 在 处 理光 数 忙 于 擦 去 和 重 画 字符 串 时 到 达 又 会 如 何 ? 

这 个 问题 的 分 析 留 作 习 题 。 在 这 个 程序 中 使 用 signal, 到 底 是 递归 还 是 阻 蹇 依赖 干 你 的 
AA. 

2， 下 一 步 做 什么 ? 

如 何 扩展 bounceld 为 一 个 弹 球 游 戏 ?” HAC, AOR SR" hello”, AA" O BAT 
球 。 然 后 ,要 让 球 在 左右 移动 之 外 还 可 上 下 移动 。 为 了 增加 上 :下 移动 的 能 力 要 洪 加 状态 变 
景 。 现 在 已 经 有 col 和 row 来 记录 球 的 位 置 .dir 来 记录 水 平移 动 方向 。 如 果 要 使 球 能 上 下 
£z) XR ES zs E e UE? 


7.11.2  bounce2d.c: 两 维 动画 
程序 bounce2d 产生 两 维 的 动画 ,可 以 让 用 户 控制 水 平 速度 和 牌 直 速 庶 ,如 图 7.21 所 示 ， 






y ox 


图 7.21 两 维 动 画 


bounce2d 的 3 个 设计 部 分 与 bounceld 相同 ， 

(1) 计时 器 驱动 

[8I EE THAE Sx UL ERA P^ ^E dE] ZY SIGALRMS 信和 号 流 。 响 应 一 个 信号, 球 向 前 移动 
一 步 。 | 
(2) STF BEA ffi A 
程序 阻 赛 等 待 键盘 输入 。 根 据 用 户 掖 下 的 键 的 不 同 采 到 不 同 的 动作 。 
(3) 状态 变量 
变量 记录 了 球 的 速度 和 方向 。 用 户 输入 修改 的 变量 值 决 定 了 小 球 的 速度 .计时 器 处 理 


«214 * Unix/Linux 编程 实战 教程 





函数 根据 速度 和 位 置 变量 来 决定 在 何 时 何 处 对 小 球 ， 

看 起 来 都 很 像 bounceld。 但 这 里 有 一 点 不 同 ,这 是 一 个 重要 的 问题 .如何 计 球 和 斜 痢 
移动 ? 

让 球 斜 着 移动 是 一 个 新 闻 题 。 在 一 维 的 程序 中 ,每 个 计时 器 信号 促使 影像 在 屏幕 上 移 
动 一 个 单位 。 这 样 就 很 简单 : 一 个 信和 号、 一 个 单位 。 但 是 在 两 维 的 动画 中 ,情况 就 个 这 么 人 简 
AT, 考虑 一 下 几 7. 22 所 示 的 路 径 。 这 种 情况 下 ,每 垂直 移动 一 个 单位 ,水 平移 动 3 个 单 
位 。 一 种 方法 是 在 收 到 每 个 计时 器 信号 时 将 影像 从 A 移动 到 B。 当 两 个 直角 边 成 一 定 比 便 
时 ,影像 的 跳 牙 可 能 比较 大 。 上 比如 当 上 比例 为 3/4 时 每 次 跳 唉 达到 5 个 单位 。 


问题 : Mite OF RMA BAB 
动 到 单元 B? 





图 7.22 直角 边 之 比 为 1/3 的 移动 路 径 


每 次 移动 一 个 单位 看 起 来 比较 好 。 当 站 第 边 的 比 为 1/3 的 时 候 , 影 像 如 图 7. 23 那样 一 
个 单位 一 个 单位 的 移动 。 注 意 ,影像 每 横向 移动 3 个 单位 纵向 就 移动 一 个 单位 。 横 向 移动 的 
步 数 是 纵向 移动 步 数 的 3 售 。 

这 样 看 起 来 像 有 两 个 计时 器 。 考 虑 只 有 一 个 计时 如 。 每 隔 两 个 时 钟 信号 影像 呵 右 移动 
- :个 单位 。 每 隔 6 个 时 钟 信号 程序 将 影像 向 上 移动 一 个 单位 。 这 和 样 球 就 会 斜 着 移动 。 如 果 
时 钟 间 隐 单 位 分 别 为 10 和 30 的 话 ,那么 球 移动 的 路 径 相同 ,就 是 慢 些 。-- 个 稳 序 只 有 一 个 
真实 的 间 隐 计时 器 ,所 以 要 构造 两 个 自己 的 计时 器 。 这 两 个 自己 的 计时 器 是 由 真实 的 间隔 
计时 器 了 驱动。 这 里 采用 图 7.23 所 示 的 逻辑 来 驱动 两 维 动画 。 


为 了 模 氢 对 角 线 移动 ,需要 

每 两 个 计时 器 信号 向 而 移动 一 个 单位 ,每 六 个 
计时 器 信号 向 上 移动 一 个 单位 。 

这 种 的 技术 需 夏 两 个 计时 器 。 一 个 记录 不 平 
移动 的 计时 项 信号 数 ,一 个 记录 垂直 黎 动 的 计 
时 器 信和 导数 。 





图 7,23 每 次 移动 一 个 单位 更 好 


为 了 能 同时 在 两 个 方向 移动 ,用 两 个 计数 器 来 充当 计时 器 。 就 像 系 统 的 问 申 计时 器 由 
两 部 分 组 成 一 样 ,每 个 计数 器 都 有 两 个 属性 : 当前 值 和 间隔 。 当 前 值 表示 在 下 次 重 画 之 前 还 
可 等 待 多 少 个 计时 信号 。 癌 隔 指 明黄 次 移动 之 间 所 要 等 待 的 计时 信号 个 数 。 两 个 成 员 变 量 
分 别 命 名 为 ttg 和 ttm。 代 码 如 下 : 


/* bounce2d 1.0 


* bounce a character (default is !'o') around the screen 
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x defined by some parameters 

证 

* user input. s slow down x component, S. slow y component 

* f speed up x component, F; speed y component 

x Q quit 

* 

* blocks on read, but timer tick sends SIGALRM caught by ball move 
* build; cc bounce2d.c set ticker.c — lcurses - o bounce2d 

x / 

H include «< curses, h> 

# include < signal. h> 


d include “bounce. hn 
struct ppball the ball ; 
/* * the main loop * x / 


void set up(): 


void wrap up); 


int maint} 
{ 
int c; 
set up; 
while ( ( c = getchar()} t= 'Q' H 
if (g == 'f1) the bail. x ttm--: 
else if (c == 'g!' J the ball.x ttm++: 
else if { == Ft )the ball. y ttm-— ; 
else if (c == 'S' )the ball, y ttm *t* ; 
f 
wrap up(); 


| 


void set up() 
/* 
* init structure and other stuff 
xy 
i 
void ball movel int) - 


Ir 


the ball. pos Y INIT; 
the ball.x pos - X INIT; 
the ball.y ttg = the ball.y ttm Y TTM ， 
the ball.x ttg = the ball,x ttm = X TTM; 
the ball.y dir = 1: 


f 
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the ball.x dir = 1; 
the ball. symbol = DFL SYMBOL ; 


initscrí(); 
noechot) - 
crmade() ; 


signal( SIGINT , SIG_IGN); 
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mvatddch( the ball.y pos, the ball,x pos, the_ball. symbol ); 


refresh(): 


signal( SIGALRM, ball move ] ， 
set ticker( 1000 / TICKS PER SEC ):; 
/* send millisecs per tick x/ 


void wrap upd) 


1 


set ticker( 0}; 


endwin(?; 


void ball move(int signum) 


fi 
1 


int y cur, x cur, moved; 
signal{ SIGALRM , SIG IGN ); 
the ball.y pos ; 


the ball.x pos ; 


moved = 0. 


F 


y cur = 


Xx cur = 


if ( the ball. y ttm > D && the ball. y ttg-— 
the ball.y pos += the ball.y dir ; 
the ball.y ttg - the ball.y ttm 


moved = 1- 


F 


* 


} 


if ( the ball. x ttm > 0 && the ball.x ttq-- 
the ball.x pos += the ball,x dir 
the ball.x ttg = the ball.x ttm; 


moved = 1- 


, 


a 
s, 


} 


if ( moved )| 
myaddch{ y cur, x cur, BLANK 5; 
mvaddch( y cur, x cur, BLANK 5; 
mvaddch( the ball.y pos, the ball.x pos, 
bounce or lose( &the ball); 


/* put back to normal «/ 


/* dont get caught now x*/ 
/* old spot x/ 


/* move +/ 


/* reset «/ 


1 2i 


/* move x*/ 


/* reset x/ 


the ball.symba! 5; 
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nove(LINES ~ 1,COLS - 1); 
refresh(): 


i 
signali SIGALRM, ball move): /* for unreliable systems */ 


} 


int bounce or lose(struct ppball x bp? 
{ 


int return val = 0 > 


if ( bp->y_pos == TOP ROW }{ 
bp->y_dir = 1; 
return val = 1; 
} else if ( bp —y pas == BOT ROW )| 
bp-—vy dir = -1; 
return val = 1; 


| 
if ( bp-—x pos == LEFT EDGE | 
bp-—x dir = 1; 
return val = 1; 
| else if ( bp——x pos == RIGHT EDGE 2| 
bp——x dir = -1; 


return val - 1; 


return return val; 


$ 

头 文件 为 : 

/* bounce. h xf 

/* some settings for the game +/ 


# define BLANK 1 1 

# define DFL SYMBOL ror 

# define TOP ROW 5 

H define BOT ROW 20 

# define LEFT EDGE 10 

# define RIGHT EDGE 70 

H define X INIT 10 /* gtarting col x/ 
Hdefine Y INIT 10 /* starting row  »x/ 

f define TICKS PER SEC 50 /* affects speed »/ 


Hdefine X TIM 5 
idefine Y TIM 8 


2]7 * 
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/* * the ping pong ball ++, 
struct ppball | 
int y pos, x pos, 
y ttu, x ttm, 
y ttg, x ttg, 
y dir, x tir; 


char symbol ; 
Es 


7.11.3 完成 游戏 


剩 下 的 工作 作为 练习 留 给 读者 。 需 要 添加 挡 板 控制 球 的 代码 ,将 球 从 挡 和 板 弹 问 的 代码 ， 
判断 球 是 否 已 经 飞 出 界 的 代码 等 。 | 

AA ILEAY SD SAAT CARRERE. NORD CLE] AJnpBE, (Fb 
方 的 代 个 会 在 一 个 时 间 多 次 被 调用 ? 想 让 计时 器 处 理 函 数 设计 成 递归 调用 的 ,还 是 阻塞 后 
mig m? 


7.12 输入 信号 : 异步 1/O 


本 章 的 动画 和 游戏 等 待 两 类 事件 : 计时 器 信号 和 键盘 输 和 人 。 设 置 问 阳 计时 器 的 处 理 函 
数 来 控制 动画 ,通过 调用 getch 阻塞 程序 以 等 待 键盘 和 输入。 除了 阻塞 ,还 能 像 得 到 计时 器 信 
号 那 樟 通 过 信和 号 来 得 到 用 户 的 输入 吗 ? 

可 以 的 。 程 序 可 以 要 求 内核 在 得 到 输入 时 发 送信 号 。 这 有 点 像 要 求 邮递 员 在 投递 邮件 
时 按 门铃 。 这 样 你 就 不 用 坐 在 大 门 前 整 天 盯 着 邮件 箱 而 干 些 其 他 什么 事情 或 者 睡觉 。 任 何 
时 候 只 要 一 有 信 到 你 就 能 知道 。 

Unix 有 两 个 异步 输入 (asynehronous inpub) 系 统 。 一 种 方法 是 当 和 输入 就 绪 时 发 送信 和 号， 
另 一 个 系统 当 输 入 被 该 入 时 发 送信 号 。UCB 中 通过 设置 文件 描述 块 (file descriptor) #9 O_ 
ASYNC 位 来 实现 第 一 种 方法 。 第 二 种 方法 是 POSIX 标准 , 它 调用 aio_read。 下 面 将 学 习 这 
两 种 方法 。 首 先 ,来 大 看 这 么 做 的 想法 。 


7.12.1 使 用 异步 IO 


新 版 本 的 反弹 程序 如 图 ?7.24 上 所 示 。 需 要 两 种 信和 号; SIGIO 和 SIGALRM, ,所 以 要 建立 
两 个 处 理沙 数 。SIGIQ 处 理 盟 数 读 人 击 键 并 根据 读 人 的 数据 采取 行动 。、SIGALRM sb p 
RK a ER WN ET. CR RR ART RE Gl. 


7.12.2 方法 1: 使 用 OASYNC 


使 用 O_ASYNC 再 鉴 对 原 有 购 弹 球 程序 做 4 处 改动 ， 首先 要 建立 和 设置 在 键盘 输入 时 
被 调用 的 处 理 函 数 。 其 次 ,使 用 fentl df F SETOWN 命令 来 告诉 内 核发 送 输入 遂 知 信号 给 
进程 。 其 他 进程 可 能 也 连接 到 键盘 。 这 里 不 想 让 这 些 进程 发 送信 和 号。 第 三 ,通过 调用 fentl 
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图 7. 24 





一 一 一 一 一 一 一 


col dir data 
um | ES rd 


on input() 


+ TU 
— 


8g AA Har BE BAK (FS 


来 设置 文件 描述 符 0 中 的 O_ASYNC 位 来 打开 给 入 信息 .最 后 ,循环 油 用 pause 等 待 来 自 计 
时 器 或 键盘 的 信号 。 当 有 一 个 从 键盘 来 的 字符 到 达 , 内核 向 进程 发 送 SIGIO fl 2, SIGIO 
的 处 理 贤 数 使 用 标准 的 curses MH geirch 来 该 入 这 个 字符 。 当 计时 器 间隔 超时 ,内 核发 送 以 
前 已 经 处 理 的 SIGALRM 信和 号。 以 下 是 源 代 码 . 


/* bounce, asyne.c 
animation with user control, using O ASYNC on fd 
set ticker() sends SIGALRM, handler does animation 


* purpose 
* note 

* 

* compile 
*/ 

8 include 
i include 
4 inciude 


4 inciude 


keyboard sends SIGIO, main only calls pause() 
cc bounce async.c set tiCker.c - l curses - o bounce async 


< stdio. h> 
« curses. h> 


<signal, h> 
« fentl. k> 


/* The state of the game «/ 


B define 
+ define 


int row 
int col 
int dir 
int delay 


int done 


maLn{ ) 


| 


void 


MESSAGE "hello" 
BLANK u " 


on alarm(int); 


/* current row x/ 
/x current column «/ 
/* where we are going «/ 


/* how long to wait «/ 


/* handler for alarm >/ 
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void on input(int); /* handler for keybd «/ 
void enable kbd signals(); 
initscr( ; /* set up screen */ 
crmode(). 
noecho(); 
clear(; 
signal(SIGIO, on input); /* install a handler xj 
enable kbd signalsO; /* turn on kbd signals x/ 
signal(SIGALRM, on alarm); /* install alarm handler */ 
set ticker(delay) > /* start ticking »/ 
moved row, col): /* get into position x/ 
addstr( MESSAGE ); /* draw initial image */ 
while( 1 done } /* the main loop «/ 

pause():; 

endwin(); 


} 
void on input(int signum) 
1 


int c = getch(); /* grab the char «/ 


if { e == 'Q' || e == EOF) 
done = 1; 

else if ( == ıs) 
dir = - dir; 


void on alarmíint signum) 


| 


signal(SIGALRM, on alarm); 
mvaddstr( row, col, BLANK ); 
col += dir; 

mvaddstr( row, col, MESSAGE 5; 


refresh():; 


/* 
x now handle borders 


xf 


if (dir == —1&&coi <= 0) 


dir = 1. 


f 


reset, just in case */ 
note mvaddstr() */ 
move to new column x/ 
redo message x/ 


and show it */ 


else if ( dir == 1 && col + strlen( MESSAGE) >= COLS ) 


dir = = le 
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/* 
* install a handler, tell kernel who to notify on input, enable 


* Signals 
x / 
void enable kbd signals() 
| 
int fd flags; 


fcntl(O, F SETOWN, getpid()?; 


fd flags = fontl(d, F_SETFL); 
fentl(0, F_SETFL, (fd flags|O ASYNC)); 


7.12.3 AŽ 2. 使 用 aio read 

相 比 设置 文件 描述 符 的 O_LASYNC 位 ,使 用 ajo read 更 如 灵活 ,当然 也 复杂 些 。 对 原来 
的 弹 球 程序 做 4 处 改动 。 

-党 一 , 设 转 笨 人 被 谈 人 时 所 调用 的 处 理 熙 数 on input, 

第 二 ,设置 struct kbebuf 中 的 变量 来 指明 等 待 什 么 类 型 的 输 人 , 当 和 输入 发 生 时 产生 什么 
信号。 在 这 个 简单 的 程序 中 ,需要 从 文件 描述 符 0 中 读 人 -- 个 字符 , 当 字符 被 读 人 时 希望 收 
到 SIGTO 信号。 实际 上 能 指定 任何 信号 ,其 全 是 SIGARLM 或 SIGINT, 

BS JER te MBA AEA aio read 来 递 变 读 人 和 人 请求。 和 调用 一 般 的 read 不 
同 ,aio_read RM RU. HR aio read 会 在 完成 时 发 送信 号 。 

现在 这 个 程序 可 以 做 任何 它 想 做 的 事情 了 了 。 在 下 面 这 个 简单 的 例子 中 ,只 是 调用 pause 
来 等 得 信号 。 当 用 户 输入 字符 ,aio_read 向 进程 发 送 SIGIO 信号 ,响应 处 理 函 数 被 调用 。 

最 后 ,实现 处 理 函 数 , 画 数 通过 调用 alo return 来 得 到 输入 的 字符 。 然 后 处 理 这 个 字符 。 


/* bounce aio.c 
* purpose animation with user control, using aio read() etc 
x note set ticker() sends SIGALRM, handler does animation 
* keyboard sends SIGIO, main only calls pause() 
* compile cc bounce aio.c Set ticker.c - lrt -1 curses ~o bounce aio 
ef 
HK include <stdio.h> 
B include < curses. h> 
# include «signal. h> 


i include aico. h> 
/* The state of the game x/ 


it define MESSAGE "heilo" 
+ define BLANK 


int row - 10; /* current row #/ 
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int col = Q; /* current column +,/ 
int dir = ]; /* where we are going */ 
int delay = 200; /* how long to wait */ 
int done = 0; 
struct aiocb kbcbuf; /* an aio control buf */ 
main() 
i 
void on alarm(int); /* handler for alarm */ 
void | on input(int); /* handler for keybd */ 


void setup aio buffer(); 


initscr(); /* set up screen x/ 

crmodet } ; 

noecho(); 

clear(): 

signal(SIGIO, on, input); /* install a handler «/ 

setup aio buffer(); /* initialize aio ctrl buff «/ 
aio read(&kbcbuf), /* place a read request 4, 
signal(SIGALRM, on alarm); /*install alarm handler «/ 
Set ticker(delay); /* Start ticking 


mvaddstr( row, col, MESSAGE ); /* draw initial image */ 


while( ! done ) /* the main loop x/ 
pause()- 
endwin(); 
t 
fx 
* handler called when aio read() has stuff to read 
* First check for any error codes, and if ok, then get the return code 
*/ 
void on input() 
1 
int c; 


char * cp = (char + ) kbcbuf.aio buf; /x cast to char * + / 


/* check for errors x/ 

if ( aio error(&kbcbuf) |= Q0) 
perror( "reading failed"); 

else 
/* get number of chars read x/ 
if ( aio_return(&kbebuf) == 1 3 
i 
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c= *Cp; 

if Cc == 10)! || e == EOF } 
done = 1; 

else if (c == '1) 


dir = -— dir; 


/* place a new request x/ 


aig_read( &khbebufl} ; 


void on alarm) 


1 


signal(SIGALRM, on alarm); /* reset, just in case x/ 


mvaddstr( row, col, BLANK 5; /* clear old string */ 
col += dir; /* move to new column x/ 
mvaddstr( row, col, MESSAGE ); /* draw new string */ 
refresh(); /* and show it x/ 


ix 


* now handle borders 


x/ 

if ( dir == -1&& col <= 0) 
dir = 1; 

else if ( dir == 1 && col + strlen(MESSAGE) “>= COLS) 
dir = -1; 

! 

/* 


* set menbers of struct, 
* First specify args like those for read(fd, buf, num) and offset 
x Then specify what to do (send signal) and what signal (SIGIO) 
x/ 

void setup aio buffer() 


1 


static char input} 1]: /* 1 char of input */ 
/* describe what to read x/ | 
kbcbuf.aio fildes - 0; /* standard intput */ 
kbcbuf.aio buf - input; /* buffer +/ 
kbcbuf.aio nbytes -1; /x number to read «/ 
kbebuf.aio offset 24 /* offset in file «/ 


/* describe what to do when read is ready x/ 
kbcbuf.aio sigevent.sigev notify = SIGEV SIGNAL; 
kbcbuf.aio sigevent.sigev signo = SIGIO; /x send sIGIO «/ 
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7.12.4 RER PRERA EB 


不 。 用 户 输入 阻塞 程序 ,间隔 计时 器 驱动 奈 移 动 的 模式 工作 的 很 好 。 异 步 访 人 的 优 努 
在 于 程序 不 用 被 输入 阻塞 而 可 以 做 些 其 全 什么 : 

比如 一 个 更 有 想象 力 的 程序 可 以 用 这 段 时 间 放 六 乐 . 朱 成 声响 和 效果、 计算 复 染 的 背景 图 
案 , 甚 至 于 柳 -- 些 公共 服务 。 栽 来 越 多 的 计算 机 贡献 出 空 闪 时 间 来 带动 计算 数学 、 大 文 棕 或 
医学 领域 的 一 些 大 计算 量 的 荆 作 。 

弹 球 程序 可 以 用 它 的 空 采 时间 计算 任意 精度 的 pi 值 .用 异步 输 和 人 来 响应 用 户 的 键盘 输 
A. Af main 中 的 循环 做 以 下 修改 : 


改动 之 前 的 程序 ， 改动 之 后 的 程序 : 
while(! done} compute pil); 
pauset ); endwint): 
endwint) ; 


修改 后 监督 程序 调用 函数 来 计算 pi fH. MPTE AE — he I EST AE es BOR Gb E 
输入, 然后 继续 计算 。 当 接收 到 一 个 计时 部 同 申 消息 ,程序 跳 到 相应 的 处 理 申 数 去 处 理 计时 
消息 ,处 理 结 束 后 继续 计算 pi fft. 

如 这 个 程序 需要 用 新 的 方法 来 处 理 “Q” BR TORE. E EE RAE OK ARIAT H 
的 呢 ? 


7.12.5 异步 输入 .视频 游戏 和 操作 系统 


本 昔 并 始 的 时 候 对 视频 游戏 和 操作 系统 做 了 了 对比， 本 章 的 弹 球 游戏 不 需要 异步 输入 ， 
但 操作 系统 需要 。 内 核 要 运行 程序 而 不 能 把 时 间 浪 费 在 等 待 用 户 输入 上 。 内 核 设 置 当 键 
盘 、. 串 口 或 网 卡 得 到 输 人 时 被 调用 的 处 理 函 数 。 内 核 从 一 个 运行 中 的 程序 此 转 到 处 理 函 数 ， 
处 理 输入 ,再 跳 回 运行 中 的 程序 。 在 临界 区 ,内 核 阻 塞 信 和 号。 

内 核 的 异步 输入 是 由 硬件 实现 的 ,而 进程 的 异步 输入 是 由 软件 实现 的 。 它 们 之 间 有 
什么 联系 吗 ” 放 戏 正在 运行 。 突 然 用 户 掖 下 一 个 键 ,… 个 电子 佑 导 被 类 到 键盘 端口 。 键 
盘 奖 口 产 生 一 个 真实 的 硬件 信号 。 这 个 信号 引发 控制 从 视频 游戏 的 运行 中 转 到 键盘 的 设 
fr SK ah. 

内 核 的 设备 驱动 代码 从 输入 端口 读 入 字符 ,然后 将 读 人 的 字符 通过 终端 驱动 进行 处 理 ， 
如 果 驱 动 的 文件 描述 符 锌 设置 为 异步 输入 ,内 核 呵 进程 发 送信 妨 。 当 进程 继续 运行 时 ,控制 
转移 到 进程 内 的 信号 处 理 硝 数 ， 


小 zt 


1 主要 内 容 
。 有 些 程序 的 控制 流 很 简单 。 而 另外 一 些 则 点 响应 外 部 的 事件 。 一 个 视频 游戏 要 响应 
时 钟 和 用 户 输入。 操作 系统 也 要 啊 应 时 钟 和 外 设 。 
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。 curses BEA — EF] DLE RB eR SM AR. 
。 一 个 进程 通过 设 莘 计时 器 来 安排 事件 。 每 个 进程 有 3 NHS. TEIG I 
发 送信 号 来 下 知 进程 。 每 个 计时 器 都 可 以 被 设置 为 愉 发 送 一 次 信号 ,或 者 按 固定 的 
fel RATE AS 
。 处 理 一 个 信号 很 简单 。 同 时 处 理 多 个 信和 号 就 复杂 些 了 。 进 程 能 决定 是 忽 栈 信和 号 还 是 
阻塞 依 号 。 进 种 能 够 告知 内 核 哪 些 信号 在 什么 时 候 阻 塞 或 忽略 。 
* 有 些 丽 数 执行 一 些 复 薪 的 任务 是 不 能 被 打 断 的 。 程 序 可 以 通过 小 心 她 使 用 售 导 掩 珊 
来 保护 这 些 临界 区 代码 。 
2. ,进一步 的 问题 
本 章 中 ,了 解 到 视频 游戏 是 如 和 何 通过 接收 和 处 理 信 号 来 同时 做 几 件 事情 的 。Unix 同时 
运行 几 个 程序 。 进 程 是 如 何 运 行 的 ?进程 来 自 何 处 ?下面 将 注意 力 从 操作 系统 的 基本 概念 
和 原则 转 到 如 何 创 建 进程 .如 何在 进程 问 通信 这 些 细节 上 。 


a 


7.] 


fag 


7.3 


7.6 


习题 


pause 等 得 任何 信号 的 到 达 , 包 括 从 键盘 生成 的 信和 号 ,比如 SIGINT. 
(1) 运行 sleep] 然后 按 下 Ctrl-C。 会 有 什么 现象 ”为 什么 ? 

(2) ik sleep] 以 处 理 SIGINT. 

(3) 再 运行 程序 , 按 下 Ctrl-C 又 会 如 何 ” 为什么? 


在 有 些 情况 下 , 慢 速 设备 (Slow Devices) 的 read 系统 调用 可 以 被 中 断 。 比 如 用 户 
可 以 通过 按 下 Ctrl-C 来 中 断 程序 从 键盘 读 人 和信。 而 田 一 些 情 况 下 ,比如 程序 在 调 
用 read 从 磁盘 读 入 ; 按 下 Ctrl- 己 则 不 会 中 断 系 统 调用 。 

通过 该 手册 或 者 查找 Web 来 学 习 有 关 尾 速 设备 的 知识 。 哪 些 read 的 调用 可 以 被 
mer? 哪些 不 能 ?” 为 什么 ? 


sigprocmask 和 ISIG 另 一 种 方法 来 防止 重 人 临界 区 代码 不 被 键盘 信号 打 断 的 广 
法 是 关 掉 tty 驱动 中 的 1SIG。 这 个 方法 和 存 信 号 掩 码 上 添加 这 些 信 号 有 什么 
不 同 ? 


发 明 一 种 可 重 人 的 系统 ,该 系统 多 持 人 们 到 你 的 办 公 室 来 将 他 们 的 名 字 和 和 地址 登 
记 在 列表 中 。 试 给 出 一 种 算法 ,该 算法 中 信号 处 理 函 数 在 每 次 被 调用 时 向 一 个 文 
本 文件 的 末 昨 添加 3 行 数 据 。 看 看 第 5 音 有 关 文 件 自动 增长 模式 (auto-append 
mode) 和 和 采用 link 来 锁 住 文件 的 练习 。 


讨论 如 果 bounceld. c 中 执行 move msg 一 次 的 时 间 比 计时 器 的 癌 隔 要 长 的 情况 
下 会 如 何 。 变 量 pos 会 如 何 ? 屏幕 会 有 什么 表现 ?在 阻塞 和 递归 两 种 情况 下 回 管 
这 些 问题 。 有 没有 工 不 丢失 信和 号 同时 又 防止 数据 损 般 的 方法 ? 


企 一 些 版 本 的 Unix 中 ,计时 器 信号 被 处 理 的 话 会 中 断 对 getch 的 调用 。 这 些 系 统 
中 被 计时 器 信号 中 断 的 getch 会 返回 EOF。 这 对 程序 有 什么 影响 ”这 些 影 响 会 产 
生 问 题 吗 ? AER Ah AS? 


+ * Unix/Linux in RES E 


一 


7.7 RAR AMARA MT AS eb, WR SIGIO 在 程序 处 理 SIGALRM 的 
时 候 到 达 会 如 何 ? RS RW? 两 个 处 理 函 数 会 相互 影响 吗 ?y 在 处 理 入 号 的 
时 候 要 阻塞 其 他 信号 吗 ? 递归 调用 又 如 何 ? 如 果 新 的 字符 在 程序 处 理 SIGIO 时 
到 这 会 不 会 有 了 问题? 
列 出 所 有 可 能 的 组 全 ,同时 列 出 可 能 引发 的 问题 。 





4， 编 程 练习 

7.8 有些 浏览 器 支持 因 炸 字符 和 移动 字符 (theater-marquee text), Wg hellol. c 以 显示 
闪烁 字符 。 如 果 用 户 在 命令 行 提 供 . 一 段 字 符 串 BREAN SES ,否则 就 
显示 默认 的 字符 串 。 用 sleep 让 程序 在 打印 和 擦 除 字符 串 之 间 人 停顿。 


7.9 使 用 curses 来 实现 移动 字符 效果 ,并 用 这 个 效果 显示 一 个 文件 的 内 容 。 移动 字符 
W R (Theater Marquee) (或 者 传动 带 效 果 Ticker Tape) 蚌 在 一 个 水 平 区 域 中 水 平 
地 逐 宇 地 滚动 显示 字符 吝 。 程 序 应 该 能 从 命令 行 中 读 和 人 文件 名 和 显示 串 的 长 度 、 
MERER. | 


7.10 修改 hello5.c; 用 usleep 9 X sleep ,选择 一 个 能 够 平滑 但 不 太 快 的 秽 动 时 间 间 
Fa t. 
PREFETA PERRA B OEE. mE FERA. AREFE 
HI PLE RE L Re E FA DR VERE FB 5 PERS fni VR ERE, 
AUS SAE LTT ABM ASIP, 和 修改 程序 使 之 能 模拟 重力 的 加 速 作 
用 。 可 以 做 的 更 加 真实 些 , 在 字符 绅 擅 击 地 而 时 雁 裂 成 四 处 飞溅 的 小 字符 。 


7,11 £F ticker demo. c 从 信号 处 理 函 数 退 出 。 能 否 修 改 程 序 使 之 从 main ag IR H1 
而 不 是 信号 处 理 函 数 。 添 加 一 个 名 为 done 的 全 局 变量 。 然后 对 原来 的 程序 再 做 
两 处 修改 使 之 能 从 main JR il), WMATA MBE (EA? 


7.12 fm sigdemo3. c, 把 两 个 信和 总 处 理 王 数 台 并 成 一个。 丰台 并 后 的 处 埋 上 晒 数 中 通 
过 检查 参数 来 判断 是 什么 类 型 的 信 叶 和 甬 发 处 理 静 数 的 调用 。 这 一 改动 会 对 程序 
的 行为 有 何 影响 ? 


7.13 (RATE SEA LSS ,然后 起 了 退出 的 经 历 吗 ? 一 个 后 台 运 行 的 程序 在 一 定 的 空 

用 时 间 后 向 登录 命令 解释 进程 发 送 SIGKILL 消息 会 很 有 用 。 

(D S EET tmeout.c。 这 个 程序 接 有 党 命令 行 参数 包括 进程 ID 利 秒 数 。 程 序 睡 眠 指 
定 的 秘 数 后 向 指定 的 进程 发 送 SIGKILL 信和 号。 可 以 从 命令 解释 进程 用 limeout 
$$ 3600 & 命令 来 启动 程序 。 符 号 8$ 表 示 命 令 解释 进程 的 ID. 

(2) timeout. c 的 问题 是 一 个 小 时 以 后 就 算 你 还 在 工作 它 还 是 会 让 你 退出 。 修 改 
程序 使 之 只 在 你 的 tty 没有 输 人 /输出 10 Sp PRESE oh IB. (Eon: /dev/ 
ttyxx 的 修改 时 间 代 表 了 最 后 一 次 从 设备 读 人 或 写 出 数据 的 时 间 。 修 改 程序 
使 之 能 够 以 参数 的 形式 接受 tty BAT.) 


7. ]4 


fac 


rpm un 


第 ?7 章 事件 驱动 编程 : 编写 一 个 视频 游戏 "221 。 


在 本 练习 中 将 写 一 个 程序 在 用 户 层 模 拟 图 7, 14 演示 的 情况 。 说 明 如 何 由 一 个 实 
际 时 钟 驱动 两 个 不 同 的 计时 器 。 
首先 ,基于 sigdemol.c 写 一 个 名 为 ouch. c 的 程序 。 也 就 是 第 6 BHA OUCH 
fay. ouch c 将 从 命令 行 接 受 两 个 参数 。 一 个 是 信号 人 勾 理 隔 数 要 打印 的 字符 
串 , 另 一 个 是 信和 号 处 理 函 数 在 打印 之 前 要 被 调用 的 次 数 。 比 如 命令 : 

5 ouch hello 10 & 
将 在 后 台 运 行程 序 ,程序 每 收 到 10 次 SIGINT 信号 打印 一 次 helle。 
然后 写 一 个 节拍 程序 ,并 命名 为 metronome. c. ix UT M POPES ER 
ID 列表 . 程序 用 间隔 计时 叭 来 生成 间隔 为 1 秘 的 SIGALRM fg tr, Sb RRA 
H kill 系统 调用 向 指明 的 进程 发 送 SIGINT 信和 号， 比如 和 节令， 

5 metronome 1 3456 7777 2345 
将 每 隔 1 秒 钟 向 ID 为 3456,7777 和 2345 的 进程 发 送 SIGINT 信号， 
在 后 台 启 动 3 个 ouch 实例 的 进程 。 给 每 个 进程 不 同 的 消息 字符 串 条 向 队 。 然 后 记 下 
它们 的 DD。 最 后 以 1 和 那些 进程 的 ED 作为 参数 来 启动 metronome 程序 。 


用 usleep O 3€ BH. 3E T2 FF. . FH AE 8 pR EX oe b ST A. 在 bounceld. c 中 主 循 坏 在 
getch gk EH 3E . fi S Rh FEBR BE d zi]. ECT hellob. c 的 机 制 重 写 bounceld. 
c。 在 新 的 版 本 中 有 用户 输入 和 动画 的 角色 将 被 调换 ,也 就 是 说 主 循环 在 调用 
usleep 被 阳 塞 ,程序 在 信号 处 理 函 数 中 处 理 用 户 输入 。 


写 一 个 测试 用 户 的 反应 速度 的 程序 。 程 序 等 待 一 个 随机 的 间隔 时 间 然 后 在 屏幕 
上 打印 一 个 一 位 十 进 制 数字 。 用 户 要 在 发 可 能 短 的 时 间 内 输入 这 个 数字 。 程 序 
记录 用 户 的 反应 速度 。 程 序 进行 10 次 这 样 的 测试 然后 报告 最 慢 、 最 快 和 平均 响 
MAEL (GER: 看 看 gettimeofday 的 用 户 手册 ， 


完成 本 章 开 始 措 述 的 弹 球 游戏 。 添 加 分 数 .多 几 户 、 缓 冲 器 和 其 他 任何 能 想到 的 
使 游戏 变 得 好 玩 的 机 制 。 


5. "E 
基于 本 章 学 习 的 知识 ,能够 实现 以 下 的 几 个 Unix 程序 了 : 


snake, worms 
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概念 与 技巧 

* Unix shell 的 功能 
。 Unix 的 进程 模型 
* UTP PR 
。 如 何 创建 一 个 进程 
， 父 进程 和 子 进程 之 间 如 何 道 信 
相关 的 系统 调用 

= fork 

* exec 

* wait 

* exit 

相关 命令 

* sh 

* ps 


8.1 进程 = 运行 中 的 程序 


Unix 是 如 何 运 行程 序 的 ? 这 看 起 来 很 容易 : 首先 登录 ,然后 shell 打印 提示 符 ; 输 入 命 
令 并 按 回 车 键 。 程 序 立 即 就 开始 运行 了 。 当 程序 结束 后 ,shell 打印 一 个 新 的 提示 符 。 但 这 
些 是 如 何 实现 的 呢 ? 什么 是 shell? shell 做 了 些 什 么 呢 ? ARNE A? BR ETA? A 
行 一 个 程序 意味 着 什么 ? 

一 个 程序 是 存储 在 交 件 中 的 机 器 指令 序列 。 一般 它 是 由 编译 器 将 源 代 码 编译 成 二 进 制 
格式 的 人 代码。 运行 一 个 程序 意 昧 着 将 这 个 机 器 指令 序列 载 和 内存 然 后 让 处 理 器 (CPU) 逐 条 
执行 这 些 指令 ， | 

在 Unix 术语 中 ,一 个 可 执行 程序 是 一 个 机 器 指令 及 其 数据 的 序列 。 一 个 进程 是 程序 运 
行 时 的 内 存 空间 和 设置 。 图 8. 1 显示 了 程序 和 进程 。 





Rie 进程 和 榴 序 : RMB sh s 229 * 


进程 





图 8.1 系统 中 的 进程 和 程序 


数据 和 程序 存储 在 磁盘 文件 中 ,程序 在 进程 中 运行 。 以 下 的 儿童 里 将 学 习 进 程 慨 念 。 
从 命令 ps Al sh 开始 ,然后 写 一 个 自己 的 Unix shell, 


8.2 通过 命令 ps 学 习 进 程 


进程 存在 于 用 户 空 间 ， 用 户 空间 是 存放 运行 的 程序 和 它们 的 数据 的 一 部 分 内 存 空间 . 
如 图 8.2 所 示 , 可 以 通过 使 用 psCprocess status 进程 状态 的 简写 ) 命 令 来 查看 用 户 空间 的 内 
容 。 这 个 命令 会 列 出 当前 的 进程 ， 


Ri Pis] ps 
容纳 进程 
ps -3 
ps -l 





义 件 系统 容纳 
文件 和 目录 


图 8.2 ps 命令 列 出 当前 进程 


$ PS 

PID TTY TIME CHD 
1775 pts/\ 00:00:17 bash 
1981 pts/) 00-00-00 ps 


这 里 有 两 个 进程 在 运行 : bashCshelD fl ps 命令 .每 个 进程 都 有 一 个 可 以 惟一 标识 它 的 
i ,被 称 为 进程 ID。 一 般 简 称 为 PIP。 每 个 进程 都 与 … 个 终端 相连 ,这 里 是 /dev/pts/1。 
每 个 进程 都 有 一 个 已 运行 的 时 间 。 注 意 ps 对 已 运行 时 间 统 计 并 不 是 非常 的 精确 ,从 ps 只 用 
了 0 秒 就 可 以 看 出 。 | 

ps 有 很 多 可 选项 。 和 ds 命令 一 样 ,ps X -a 可 选项 ， 
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$ ps -a 

PID TTY TIME CMD 
1779 pts/0  00;00:13 gy 
1780 pts/0  00:00.07 gs 
1781 pts/O  00;00,01 vi 
2013 pts/Z 00.00.23 xpaint 
2017 pts/2 00:00:02 mail 
2018 pts/1 00:00:00 ps 


-a 选项 列 出 所 有 进程 ,包括 在 其 他 终端 由 其 他 用 户 运行 的 程序 。 但 是 带 选 项 -a 的 输 
出 并 不 包括 shell, ps 也 有 一 个 -1 选项 来 打印 更 多 细节 : 


& ps - la 

F S UID PID PPID C PRI NI ADDR SZ WCRAN TIT TIME CMD 
000 S 504 1779 1731 0 69 0 一 1086 do sel  pts/0 00:00:13 gy 
000 5 504 1780 1779 0 68 Ü = 2309 do sel pts/0 00:00.07 gs 
000 5 S504 1781 1721 0 72 ü —. 1320 do sel pts/O 00:00:01 vi 
000 S 519 2013 1593 9 69 19 一 1300 do sel pts/2 00;00:23 xpain 
000 S 519 2017 1993 0 $9 D = 363 read c pts/2 00;00;02 mail 
000 R 500 2023 1755 QO 78 D 一 750 = pts/1 00:00:00 ps 


SASH 3 zn ep TERRAS. SIMBA RUA ps 对 应 的 进程 正在 运行 。 其 他 
进程 的 S 列 值 都 是 $, 说 明 它 们 都 处 于 睡眠 状态 。 每 个 进程 都 属于 相应 的 由 UID 列 指 明 的 
用 户 ID。 每 个 进程 都 有 一 个 进程 IDCPID) ,同时 也 有 一 个 父 进 种 IDCPPID) . 

标记 为 PRl 和 NI 的 列 分 别 是 进程 的 优先 级 和 niceness 级 别 。 内 核 根 据 这 些 值 来 决定 
什么 时 候 运 行进 程 。 一 个 进程 可 以 增 扔 niceness BH, gt ER TE EB iTi HE HE BA fS] ME P mE 
让 其 他 客户 排 到 目 己 的 前 面 。 超 级 用 户 可 以 减少 他 的 niceness 级 别 ,这 就 像 排 队 的 时 候 
4 BA 

一 个 进程 有 大 小 ,这 由 SZ 列表 示 。 这 列 的 数据 表示 这 个 进程 占用 的 内 存 大 小 。 在 例子 
中 mail 程序 比 xpaint 占用 少 得 多 的 内 存 。 因 为 后 者 耗费 大 量 的 内 存 来 存储 影像 。 程序 在 运 
行 的 时 候 占 用 的 内 存 数 量 可 能 会 动态 的 改变 。 如 果 程 序 在 运行 时 分 配 内 存 ,那么 它 占用 的 
A £F Ss o S HUI 

WCHAN 列 显示 进 程 睡眠 的 原因 。 上 面 的 例子 中 所 有 睡眠 的 进程 都 是 等 待 输入 。read 
< 或 do_sel 代 表 内 核 的 地 址 。ADDR 和 下 已 经 不 再 用 了 ,但 是 为 了 兼容 的 原因 而 保留 它们 。 
选项 -ly 将 只 显示 目前 使 用 的 值 。 

各 个 版 本 的 Unix 间 的 可 选 命令 参数 差别 很 大 。 前 面 提 到 的 -a 和 一 | 可 选项 可 能 在 你 
的 系统 中 涉 能 用 或 者 结果 不 同 。 查 阅 你 的 用 户 手 册 。 虐 面 的 便 子 是 来 自 于 版 本 号 为 procps 
2.0,6。 例 子 只 给 出 了 ps 的 一 部 分 显示 功能 。 

ps 命令 是 很 强大 的 。 -fa 可 选项 产生 如 下 输出 : 


$ ps -ffa 
UID PIB PPID C STIME TTY TIME CHD 





betsy 
betsy 
betsy 


1779 
1980 
1781 


yuriko 2013 
yuriko 2017 


bruce 


2401 


1731 
1779 
1731 
1993 
1933 
Leo 
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co ao GO G oot 


19:53 pts/0 00.00.01 gv dinner.ps 
19.53 pts/0O 00:00:07 qs 一 dNOPLATFONTS 
19:54 pts/0 00;,00.02 vi dinner 

20.15 pts/2 00:00:00  xpaint 

20:15 pts/Z 00.00 :00 mail bruce 

20:36 pts/1 00.00 00 ps — af 


-表示 格式 化 输出 ,这样 便 于 阅读 。 用 用 户 名 代替 UID 来 显示 。 在 CMD JU SUR SEE 
的 命令 行 ， 


8.2.1 


系统 进程 


除了 用 户 运行 的 进程 外 ,其 他 一 些 是 Unix 系统 用 来 完成 系统 任务 的 进程 : 


5 ps -ax | head - 25 
PID TTY STAT 


1? S 
27 SW 
37 SW 
4? SH 
5. SW 

35 ? SW 
36 7 SW 

420 ? S 

423 ? S 

437 7 SW 

449 ? S 

461 7 SH 

466 7 S 

471 ? 

476 ? 

4B4 ? SW 

500 ? S 

504 ? SW 

506 ? SH 

512 7 SW 

514 7 SH 

561 ttyi SW 


562 tty2 SW 
563 tty3 SW 


5 ps -as|wc - 1 


82 


TIME 
0.05 
3:54 
0:38 
0:00 
2:13 
0-00 
0:00 
0:25 
0:36 
0:00 
0-02 
0:00 
0:00 
0:00 
0.00 
0.00 
0-46 
0:00 
0:00 
ô -00 
0 : 06 
0:00 
0-00 
0:00 


COMMAND 

init 

[kflushd | 

[ kupdate | 

[ kpiod | 

[ kswapd | 
[uhci - control] 
[khubd] 

syslogd 

klogd ~ k /boot/System.map- 2.2.14 
[inetd | 

and - f /etc/am, d/conf 
[ rpciod] 

cron 

atd 

sendmail: accepting connections on port 25 
[rpc.rstatd] 

sshd 

| calserver | 

[ keyserver | 

| portsentry | 

| portsentry | 

[getty] 

[getty] 

[getty 


上 面 的 例子 显示 了 当前 系统 中 运行 的 82 个 进程 中 的 前 24 个 。 其 中 部 分 是 系统 进程 ， 
系统 进程 中 的 很 大 一 部 分 是 没有 终 病 与 之 相连 的 。 它们 在 系统 局 动 时 启动 ,而 不 是 由 用 户 
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在 命令 行 输 人 . 这 些 系统 进程 做 些 什么 呢 ? 

列表 中 开始 的 几 个 分 别处 于 内 存 的 不 同 部 分 .包括 内 核 缓冲 和 虚 存 页 面 。 列 表 中 的 其 
他 一 些 管理 系统 口 志 (klogd,syslogd) WERE Žž Ccron,atd) .防范 可 能 的 攻击 (portsentry) 
和 证 一 般 的 用 户 登 录 (sshdq,gerty)。 可 以 通过 ps 一 ax 的 输出 和 Unix 手册 了 解 很 多 系统 的 
WL. 运行 ps 就 像 透 过 显微镜 看 一 滴 池 超 水 。 能 看 到 很 多 各 式 各 样 的 进程 运行 在 系统 中 ，。 


8.2.2 进程 管理 和 文件 管理 


从 运行 ps 的 结 凡 大 出 进程 有 很 多 同性 ， 每 个 进程 属于 某 个 用 户 [D、 有 一 定 的 大 小 、 一 
个 起 始 时 间 .已 运行 的 时 间 .优先 级 和 niceness 级 别 。 有 些 进程 与 某 个 终端 相连 ,而 其 他 一 些 
则 设 有 。 这 些 属 性 存放 在 什么 地方 昵 ?7 曾 对 文件 提 过 同样 的 问题 。 内 核 管理 内 存 中 的 进程 
和 做 盘 上 的 文件 。 这 些 管 理 活 动 有 什么 相似 之 处 吗 ? 

文件 包含 数据 ,进程 包含 可 执行 代码 。 文件 有 一 些 属性 ,进程 也 有 一 些 属 性 。 内核 建 并 
和 和 销 虹 文 件 , 述 程 类 似 。 就 像 管 理 磁 盘 的 多 个 文件 ,内 核 管理 内 存 中 的 多 个 进程 ,为 它们 分 
配 空间 Fic mA OMAR. ARS RAMEE BETAS? 


8.2.3 内 存 积 程序 


进程 这 个 概念 有 些 抽 象 . 但 是 它 代表 了 一 些 非常 实际 的 实体 : 内 存 中 的 ee. B 
8.3 演示 了 计算 机 内 存 的 3 种 模式 。 


内 大 可 以 看 作 二 一 个 容纳 内 核 
evt gs iu. 

很 多 系统 把 内 存 看 作 由 页 而 构 
I9, WY Sx 38 . E UE B? p Bll 39] AR Ee] 
(ji my. $9 58 D. px 28 Ul qd n[ 
E t ££ dC e DEBA, 








mum x 





88.3 计算 机 内 存 的 3 种 模式 


Unix 系统 中 的 内 和 仓 分 为 系统 空间 和 用 户 空间 。 进 程 存 在 于 用 户 空间 。 内 存 实 际 上 就 是 
一 个 字 节 序列 ,或 者 一 个 很 大 的 数组 。 如 果 机 器 有 64 MB 的 内 存 , 那 意味 着 这 个 数组 有 大 约 
6700 万 个 内 存 位 置 。 其 中 的 一 些 用 来 存放 组 成 内 核 的 机 器 指令 和 数据 ， 

还 有 一 些 存放 组 成 进程 的 机 器 指令 和 数据 。 一 个 进程 不 一 定 必 须要 ,5 一 段 连 续 的 内 
仔 。 就 像 文 件 在 酸 盘 上 被 分 成 小 块 , 进 程 在 内 存 也 被 分 成 小 上 去。 同样 和 文件 有 记录 分 配 了 
的 磁 僵 块 的 列表 相似 ,进程 也 有 保存 分 配 到 的 内 存 页 面 (memory Pages) 的 数据 结构 。 因 此 ， 
将 进程 表示 为 用 户 空间 内 的 一 个 小 方块 只 是 某 种 程度 的 抽象 。 

将 内 存 表示 为 连续 的 字 节 数组 也 是 一 种 柚 象 。 现 在 的 内 存 一 般 情况 下 是 由 小 电路 板 上 
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人 


的 一 些 芯 片 组 成 。 

建立 一 个 进程 有 点 像 建立 一 个 磁盘 文件 。 内 核 要 找到 一 些 用 来 存放 程序 指令 和 数据 的 
空闲 内 存 页 。 内 核 还 要 建立 数据 结构 米 存 放 相 应 的 内 存 分 配 和 情况 和 进程 属性 。 

使 操作 系统 变 得 神奇 的 不 仅 是 它 的 文件 系统 把 一 堆 旋 转圈 盘 上 连续 的 秘 变 成 有 尺 组 
织 的 树 状 目录 结构 ,而 且 以 相似 的 机 制 , 它 的 进程 系统 将 硅 片 上 的 一 些 位 组 织 成 一 个 进程 
社会 一 一 成 长 、 相 互 影响 .合作 出生、 工作 和 和 死亡。 这 有 点 重 蚂 蚁 农庄 ， 

为 了 理解 进程 , 下 面 将 学 习 和 实现 一 个 Unix shell, shell 是 一 个 管理 和 运行 程序 的 
E. 


8.3 shell: 进程 控制 和 程序 控制 的 一 个 工具 


shell 是 一 个 管理 进程 和 运行 程序 的 程序 。 就 像 存 在 很 多 编程 语言 ,Unix 系统 有 很 多 种 
可 用 的 shell, 每 种 都 有 各 自 的 风格 和 优势 。 所 有 常用 的 shell 都 有 三 个 主要 功能 ， 

(D 运行 程序 

(2) 管理 输入 和 输出 

(3) 可 编程 

看 看 下 面 的 命令 序列 : 


S grep lp /etc/passwed 
lp:;x:4:7;lp:/var/spool/lpd: 

S TZ = PSIGPDT;export TZ;date;TZ = ESTSEDT 
Sat dul 28 02:10:05 PDT 2001 

S date 

Sat Jul ZB 05:10:14 EDT 2001 

S ls -1 /etc 7 ete, listing 


S HAHE= ip 

S if grep 5 NAME /etc/ passed 
“> then 

>> echo hello | mail $ NAME 
—fi 
1p:x;4;7;lp:/var/spool/lpd; 
S 


(D 运行 程序 

grep .date.js、echo Al mail 都 是 一 些 普通 的 程序 ,用 局 编写 ,并 被 编译 成 机 器 语言 shell 
将 它们 载 人 人 内存 并 运行 它们 。 很 多 人 把 shell 看 成 是 一 个 程序 启动 器 (program launcher), 

(2) 管理 输入 和 输出 

shell 不 仅仅 是 运行 程序 。 使 用 二 、 污 和 | 符号 可 以 将 输入 .输出 重 定向 。 这 样 就 可 以 告 
Vt shell 将 进程 的 输入 和 输出 连接 到 一 个 文件 或 是 其 他 的 进程 。 

(3) 编程 


”234 * Unix/Linux pfe 3c ROE 


shell [a] 8f ttt 8 485785 25 tet LER S i MRE BS. FLOATS a TUUS SIR FT PR 
MER. 首先 ,变量 TZCEDUE BUR OW EEDPU V EG DC TER AB. MAT QD TES 39 
给 date 命令 来 打印 当前 的 日 期 和 时 间 。 

例子 的 后 面部 分 ,可 以 看 到 有 il. then Ha), BBR NAME WENA "Ip", 
$ NAME 的 值 在 grep 命令 中 被 使 用 。grep 的 结果 由 f i f] ETT. JR TE XC F etc/ 
passwd FH 3€ SE AFER "1p" shell 就 执行 命令 echo hellal mail $ NAME, A WMA 2 ^—4 
命令 。 

在 本 章 中 , 先 来 看 看 shell 是 如 何 运行 一 个 程序 的 。 在 后 面 的 章节 中 将 学 习 shell 的 脚本 
语言 和 和 输入 .输出 的 重 定向 。 


8.4 shell 是 如 何 运 行程 序 的 


shell 打印 提示 符 ,输入 命令 ,shell 就 运行 这 个 命令 ,然后 shell 再 次 打印 提示 符 一 - -如 此 
反复 。 那 么 这 些 现象 的 背后 到 底 发 生 些 什么 ? 

一 个 shell 的 主 循环 执行 下 面 的 4 步 ( 如 图 8.4 所 示 ): 

COO HIP BRA a. out; 

(2) shell 建立 一 个 新 的 进程 来 运行 这 个 程序 ; 

(3) shell £& FF JA BERR A. « 

(4) 程序 在 它 的 进程 中 运行 下 到 结束 。 


shell 





Hot FRR SER shell 运行 一 个 程序 


8.4.1 shell 的 主 循环 
shell 由 下 面 的 循环 组 成 : 


while( ! end of input) 
get command 
execute command 


wait For command to finish 


考虑 下 面 这 个 与 shell 典型 的 互动 : 
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$ 1s 

Chap. bak Story08.tr chap0@. ps chap08, tr outline. 08 
Makefile chap08 chapO8.short code pix 

> Bs 

PID TTY TIME CMD 


29182 pts/S 00.00.00 bash 
29183  ptse/5  00;00.00 ps 
5 


用 图 8. 5 的 时 间 轴 来 表示 事件 发 生 次 序 。 其 中 时 间 从 左 同 右 消逝 。shell 由 标识 为 sh 


的 方块 代表 , 它 随 着 时 间 的 流逝 从 左 到 右 移 动 。shell MAMAS SESS l”. shell 建立 一 
个 新 的 进程 ,然后 在 那个 进程 中 运行 ls 程序 并 等 待 那个 进程 结束 。 


时 间 
& Wk 5 "om mm sc w w MON UM HB Nr B M HM WM M HM NH oW M Bow So lo » SNMEEXERNRBNMRRESASSSZJCHGPHRHRSSRBRENMES 和 
EDS eA dU 
x 等 待 退出 等 待 退 出 
qi i a ra d, —— mm RN a 
| 新 进程 | 新 进程 
vli. NL. 
| ls p p i Lo -一 Pe- < 
CUN NT 
运行 命令 退出 运行 机 今 退出 
Is "PS" 


Fel 8.5 shell 主 循环 的 时 间 轴 


然后 shell 读 人 新 的 一 行 输入 ,建立 一 个 新 进程 ,在 这 个 进程 中 运行 程序 并 等 待 这 个 进程 
结束 。 

当 shell 检测 到 输入 结束 , 它 就 退出 。 

为 了 要 写 -A shell, FBS: 

(1) 运行 一 个 程序 ; 

(2) 建立 一 个 进程 ; 

(3) 等 待 exil()。 

当 学 会 这 些 , 就 能 用 这 些 技术 来 实现 自己 的 shell F., 


8.4.2. 问题 1: 一 个 程序 如 何 运行 另 一 个 程序 


答案 ; RE val FB execvp, 

图 8.6 DRT TEE eA TR. EIAS Piatt ls -la, 一 个 程序 调用 
execyp("Is",arglist), iX B arglist 是 命令 行 的 字符 串 数 组 。 内 核 从 磁盘 将 程序 载 人 人 内存。 
命令 参数 ]s 和 -la 被 传 给 程序 ,然后 程序 开始 运行 。 简 而 言 之 : 
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Unix 如 何 运行 - BEN. fe 
exeevp . pzaghame. argiist) 
FERR 


Lo HEGE R RUY Mq x i 7 


2. X d$ EOD EH R TOE 
argv| | 传 给 这 个 程序 


a. Zira TRY 





CL erm 


8.6 cxecvp 将 程序 复制 到 内 存 后 运行 它 


(1) 各 全 调用 execvp 

(2) 内 核 从 磁盘 将 程序 载 人 
(3) PIECE arglisc 复制 到 进程 
(4) P3ER IL] main(arge,arev) 
下 面 是 运行 js ~ {的 完整 程序 . 


/* execl.c - shows how easy it is for a program to run à program 


*/ 
main() 
i 
char « avolist[3]; 
arglistíO] = "ls"; 
arglist(1] = "~ i"; 
arglist(2; = 0 ; 
printt(" *«** About to exec ls ~ lXn'"); 
execvp( "ls" , argiist ); E 
printf("»*** ls is done. bye\n”): 
} 


execvp HATER: 要 运行 的 程序 名 和 那个 程序 的 命令 行 参 数 数 组 。 当 程序 运行 时 命 
令 行 参数 以 argv[] 传 给 和 程序， 注意 ,将 数组 的 第 一 个 元 素 置 为 程序 的 名 称 ， 还 机 注意 .最 后 
— "T CK WWE null, 

编译 并 运行 这 个 程序 ， 

5 cc execl.c - o axecl 


S ./execl.c 
«<x About to exec ls - 1 
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total 28 

drwxr-x-—-- 2 bruce users 1024 Jul 14 21.02 a 
drwxr-x-—— 3 bruce users 1024 Jul 16 03.16 c 
-rw-r--r-- 1 bruce users 0 Jul 14 21:03 y 
: 


1. 第 二 条 打印 的 消息 哪里 去 了 ? 

再 看 一 下 代码 。 程 序 宣布 它 要 运行 e 程序 ,运行 ls 程序 ,然后 宣布 ls 运行 结束 。 那 么 
第 二 条 信息 昵 ? | 

… 个 程序 在 一 个 进程 中 运行 一 - 也 就 是 一 些 内 和 存 和 和 内核 中 相应 的 数据 结构 ， 这 样 ， 

execvp 将 程序 从 矿 盘 载 人 进程 以 便 它 可 以 被 运行 。 但 是 载 人 到 哪个 进程 昵 ? 这 就 是 问题 之 
所 在 : 内 核 将 新 程序 载 人 到 当前 进程 ,替代 当前 进程 的 代码 和 数据 .。 

2. cxecvp $E {1% 44 Jä 

EANES ARERR: “I E a REH Z A SRL LES] RRR AE CO 
的 脑子 做 其 他 的 事情 ," 一 种 实现 这 个 愿望 的 方法 是 拿 掉 你 的 大 脑 ,然后 装 上 爱 因 斯 坦 的 大 
脑 。 这 样 你 就 负 有 了 了 爱 因 斯 坦 的 思想 和 分 析 能 力 。 这 样 想 拥有 两 个 思维 的 愿望 就 和 原来 的 
大 脑 了 3- 起 被 拿 掉 了 了。 

cxec 系统 调用 ”从 当前 进程 中 把 当前 程序 的 机 器 指令 清除 ,然后 在 空 的 进程 中 载 人 调用 
时 指定 的 程序 代码 ,最 后 运行 这 个 蒜 的 程序 。exec 调整 进程 的 内 存 分 配 使 之 适应 新 的 程序 
对 内 存 的 要 求 。 相 网 的 进程 ,不 同 的 内 容 。 

execvpO A 2a a0 TP s 


execvp 
OO BS oooO 在 指定 路 径 中 查找 并 执行 -个 文件 n 
AME # include <lunistd, h= 
函数 原型 result = cxeevp(const char * file,const char * argv[ |? 
ey file 要 执行 的 文件 名 
argv FITER 
返回 什 =l an SR th $5 


exeevp R A rH file 指定 的 程序 到 当前 进程 ,然后 试图 运行 它 。execvp 将 以 NULL 结尾 
的 军人 符 串 列 表 传 给 程序 。execvp 在 环境 变量 PATH 所 指定 的 路 径 中 查找 file X fF. 

MARAT Ro .execvp 流 有 返回 值 ， 当 前 程序 从 进程 中 清 踪 ,新 的 程序 在 当前 进程 中 
运行 。 

3. ar 3 ae AF a) shell 

AU APE £e EBSA PRAM shell 了 。 这 里 已 经 知道 如 和 何 运 行 一 个 程序 ,还 知道 
如 何 将 命令 行 参 数 传 给 它 。 第 一 个 shell 提示 用 户 输 入 程序 名 和 参数 ,然后 运行 指定 的 程序 。 


[o d 


Do ARARA ARU TEMERE, 
®  execvp 是 … 组 基于 execve REC DAHER E rP B8 EIRE exec, 
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将 程序 命名 为 pshl.c, 它 是 带 提 示 符 的 shell(prompting shell) 的 缩写 ; 


/* prompting shell version 1 
x Prompts for the command and its arguments. 
* Builds the argument vector for the call to execvp. 
* Uses execvp(), and never returns. 


A F 


# include <istdio. h> 
# include «signal, h> 
i include «string. h> 


# define MAXARGS 20 /* cmdline argsx/ 
+ define ARGLEN 100 /* token lengths / 


int main( } 


1 


char * arglist| MAXARGS + 1]; /* an array of ptrsx/ 
int numargs - /* index into arrays / 
char argbuf| ARGLEN] ; /* read stuff herex, 
char * makeatring( >; /* malloc etc #/ 


numargs = Q; 
while ( numargs < MAXARGS } 
i 
printf("Arg| * d]? ", numargs); 
if ( fgets(argbut, ARGLEN, stdin) && * argbuf t= 'Vn') 


arglist[numargs ++ | = makestring(argbuf); 


else 
| 
if ( numargs > 0 ){ /* any args? «/ 
arglist[ numargs | = NULL; /* close list *»/ 
execute( arglist ); /* do it */ 
numargs = 0; /* and reset «/ 
I 
I 
} 
return 9: 


t 


int execute( char * arglist| 1 ) 
/* 
* use execvp to do it 
x / 
{ 
execvp(arglist[O , arglist); /* do it «/ 


perror("execvp failed"); 
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exit(1); 


1 
3 
J 


char + makestring( char * buf ) 
Ji ; 
* trim off newline and create storage for the string 
* 
1 
char * cp, * mallocí(?; 


buffístrlen(buf)—- 1] = "\a'; /* trim newline «/ 
cp = malloc( strlen(buf) + 1 5; /* get memory «/ 
if (cp == NULL | f /* or die «/ 
fprintf(stderr, “no memory\n") ; 
exit(1). 
f 
strepytcp, buf); /* copy chars x/ 
return cp; /* return ptr x/ 


i 

psht. c Æ Unix shell 的 第 一 个 草案 。pshl 要 求 每 个 字符 申 单独 的 输入 ,第 一 个 是 程序 
名 ,然后 依次 是 程序 参数 。 代 码 包 括 两 步 : CD 一 个 字符 串 一 个 字符 串 的 构造 参数 列表 
arglist ,最 后 在 数组 末尾 加 上 NULL; (2) 将 arglistL0] 和 arglist 数组 传 给 execvp, 如 图 8.7 
所 示 。 





1. Fs TUAE". 
app kii 





图 8.7 用 数组 构造 arglist 


编译 并 运行 程序 : 


$ cc pshl.c - o pshi 
$ ./pshl 
Argl]? ls 


Arg[1!? -1 
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Arg[ 2]? demodir 

Arg[ 3]? 

total 2 

drwxr-x--- 2 bruce users 1024 Jul 14 21:02 a 
drwxr-x--- 了 bruce users 1024 Jul 16 03.16 c 
-re-r--r-- l bruce users 0 Jul 14 21:03 y 
$ 


4. 它 上 怎么 退出 了 ? 

程序 运行 止 常 ,但 是 就 像 设 想 的 那样 ,execvp Al th > 78 BUTRIT CES SR T shell WE 
FRE ,然后 在 命令 指定 的 程序 结束 之 后 退出 、 这 样 shell 就 不 能 再 次 接受 新 的 命令 。 为 了 
运行 新 的 命令 ,用 户 不 得 不 再 次 运行 shel), 

shell 如 何 能 做 到 在 运行 程序 的 同时 还 能 等 待 下 一 个 命令 呢 ? 方法 之 一 束 是 启动 一 个 新 
的 进程 ,由 这 个 进程 来 执行 命令 程序 ， 


8.4.3 问题 2: 如 何 建立 新 的 进程 


答案 :一 个 进程 调用 fork 来 复制 自己 ， 

用 法 : fork: /*takes no arguments*/ 

1. & ff fork 

Ak £t FEE DR Jr SEL A Bot I8. A EG. AR E OH HY i B 
A Rol Fe 5B AN (H FE DR Pr 8 i A T A e] ST o TED: T PCR. ROR XK RR OB 

解决 的 方法 之 一 就 是 复制 一 个 自己 ,采用 三 位 影像 复制 技术 xx ECT 9 ELS T se 
等 价 的 自己 。 当 你 建 关 了 自己 的 复制 品 ,将 爱 因 斯 坦 的 大 脑 放 到 它 的 脑 元 里 ,这 样 你 就 可 以 
继续 你 原来 的 计划 和 思考 了 。 在 你 生命 中 的 某 个 阶段 ,世界 上 只 有 一 个 你 。 当 你 按 下 复制 
机 的 复制 近 钮 ,世界 上 有 了 两 个 你 。 对 自己 的 复制 有 点 像 马路 上 的 岔口 。 开 始 只 有 一 条 路 ， 
然后 有 了 两 条 。 

fork 之 前 fork 之 后 





新 的 进程 拥有 和 父 进 程 相同 的 
代码 和 数据 


RJ8.8 l[orikO M dij —^n 3t E 


aT —— ee a 
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这 就 是 系统 调用 fork 做 的 事情 。 图 8. 8 显示 了 fork 调用 前 后 的 系统 状况 。 进 程 拥有 程 
序 和 当前 运行 到 的 位 置 。 进 程 调 用 fork , 当 控 制 转 移 到 内 核 中 的 fork RBIS ARH: 

C1) 分 配 新 的 内 存 块 和 内 核 数据 结构 

(2) 复制 原来 的 进程 到 新 的 进程 

(3) 癌 运 行进 程 集 添加 新 的 进程 

(4) 将 控制 返回 给 两 个 进程 

当 你 按 下 复制 机 的 开始 按钮 后 ,世界 上 将 有 两 个 你 ,物理 上 上 上、 心理 上 都 是 相 闻 的 。 但 是 
每 个 人 将 开始 你 (他 ) 目 己 的 人 生 之 路 。 类 似 地 , 当 一 个 进程 调用 fork 之 后 ,就 有 两 个 二 进 制 
代码 相同 的 进程 。 而 且 它 们 都 运行 到 相同 的 地 方 。 但 是 每 个 进程 都 将 可 以 开始 它们 自己 的 
旅程 。 看 如 下 程序 。 

2. 例子, forkdemol.c 建立 一 个 新 的 进程 

forkdemol. c E BS ty t] El TE 5], — WE fork 之 前 ,一 名 在 fork 之 后 ， 





/* forkdemol.c 
* shows how fork creates two processes, distinguishable 


* by the different return values from fork() 
*/ 


# include <stdio.h> 


maint ) 
| 


int ret from fork, mypid: 


mypid = getpid(); /* who am i? x/ 


printf("Before: my pid is * din", mypid); /* tell the world x/ 
ret from fork = fork(): 


sleep(1); 
printf ("After; my pid is $d, fork() said * din", 
getpid(), ret from fork); 
} 
如 果 这 是 一 个 普通 的 程序 ,将 看 到 两 行 输出 ,每 行 打印 一 个 状态 。 但 是 当 它 运行 时 将 
看 到 : 

$ cc forkdemol.c - o forkdemol 
5 ./forkdemol 
Before;my pid is 4170 


After:my pid is 4170,fork() said 4171 
$ After, my pid is 4171 fork() said 0 


”这 里 可 以 看 到 三 行 输出 ,一 行 Before: 信息 和 两 行 After: 信息 。 进程 4170 先是 打印 
Before: 消息 ,然后 它 又 打印 After 消息 一 一 一 切 正常 。 另 一 个 After: 信息 是 由 进程 4171 


"44 * Unix/Linux 编程 实践 致 程 


打印 的 。 注 意 进 程 4171 没有 打印 Before: 信息 。 为 什么 呢 ? HPSS WA WA 8.9 所 
示 ) 显 示 了 进程 4170 调用 fork 前 后 发 生 了 什么 。 


fork 之 前 fork 之 后 





一 个 控制 流 进入 内 核 的 fork 模块 调用 完成 时 ， 从 fork 返回 两 个 停 制 流 
8.9 子 进 程 执行 okoz RMI 


内 核 通 过 复制 进程 4170 来 创建 进程 4171, 它 将 4170 的 代码 和 当前 运行 到 的 位 置 都 复 
dz 4171。 凑 中 当前 运行 的 位 置 是 由 随 看 代码 向 下 移动 的 箭头 表示 的 。 新 的 进程 4171 从 
fork 退回 的 地 方 开始 运行 ,而 不 是 从 开头 开始 运行 。 因 为 4171 是 从 中 间 开 始 运行 的 ,也 就 不 
打印 Before: 信息 了 ， 

3. 8]-f : [orkdemo2. ce 一 一 子 进 程 创 建 进 程 

子 进 程 不 是 从 main 函数 的 开始 ,而 是 从 fork 返回 的 地 方 开始 人 它 的 生命 之 旅 。 预 测 一 下 
下 面 程序 会 有 几 行 输出 : 


/« Forkdemo2.c - shows how child processes pick up at the return 


x From fork() and can execute any code they like, 
x even fork(). Predict number of lines of output. 
*/ 

main() 


printf("my pid is & din", getpid() ); 

Fork(); 

fork); 

fork() - 

printf("my pid is d\n", getpid() 5; 
| 


编译 并 运行 这 个 程序 .结果 如 何 ? 

4， 例 子 : forkdemo3. c Sp BEL SAE Ho Fe UE AE 

从 forkdemol. c 可 以 看 到 进程 4170 调用 fork 创立 子 进程 , 子 进程 PID 是 4171。 两 个 进 
程 有 相同 的 代码 ,运行 到 加 一 行 有 相同 的 数据 和 进程 属性 。 那 么 如 何 才能 分 辩 到 底 是 父 进 
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程 还 是 子 进 程 呢 ? 

这 两 个 进程 不 是 完全 相同 的 。 队 forkdemol. c 的 输出 可 以 看 出 ,不 同 的 进程 ,fork 的 返 
回 值 是 不 同 的 。 在 子 进程 中 fork 返回 0, 在 父 进程 中 fork 返回 4171, dE fork 的 返回 值 进 
程 可 以 很 容易 的 判断 自己 是 子 进 程 还 是 父 进程 。 

在 下 一 个 例子 forkdemo3. c 中 ,进程 根据 fork 返回 值 的 不 同 打印 不 同 的 消息 ， 


‘x farkdemo3.c - shows how the return value from fork() 


x allows a process to determine whether 
x it is a child or process 
x / 


# include < stdio. hl 


maint) 


í 


int fork_rv; 
printf("Before: my pid is *«dn", getpid()) ; 
fork rv = fork(); /* create new process */ 


if ( fork rv == -1) /* check for error «/ 


perror("fork'"),. | 


else if ( fork rv == 0} 
printf("I am the child. my pid = $ din", getpid()); 
else 
printf("I am the parent. my child is & d\n", fork rv); 
} 


下 面 是 运行 结果 : 


$3 ./forkdemo3 s 
Before: my pid is 5931 | 

I at the parent. my child is 5932 

I am the child. my pid = 5932 

$ 


fork 小 结 如 下 。 

系统 调用 fork FERR shell 只 能 运行 -条 命令 这 个 问题 所 需要 的 。 使 用 fork, A (F BE 
够 创建 新 的 进程 ,而 旦 能够 分 辨 原来 的 进程 和 新 创建 的 进程 。 新 的 进程 能 调用 execvp HM 
行 任何 肝 户 指明 的 程序 ， 

这 里 明确 建立 一 个 shell 所 需 一 项 技术 中 的 两 项 、 知 道 了 如 何 建立 进程 (fork) 和 如 何 运 
行 一 个 程序 (execvp)。 最 后 需要 知道 如 何 让 父 进程 等 待 子 进程 结束 ， 
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fork 
H 目标 创建 进程 
x FF i include<< unistd, h> 
函数 原型 | pid, t result = fork(void) Zz 
P tt 没有 
返回 值 zi 3r RS EX 


0 XR [e] FF tf 
pid 将 子 进程 的 进程 iD f:6 X utf 


8.4.4 问题 3: 父 进程 如 何等 待 子 进程 的 退出 


答案 : 进程 调用 wait 等 待 子 进程 结束 。 

用 法 : pid = wait(& status); 

l. 解释 waitC) 

系统 调用 wait 做 两 件 事 。 首 先 , wait 暂停 调用 它 的 进程 直到 子 进程 结束 。 然 后 ,wait 取 
得 子 进程 结束 时 传 给 exit 的 值 。 | 

图 8. 10 显示 了 wait Eds YEA. HORN SUA E EE SCE RYE IER PEARLS 
fcerk。 内 核 构 造 子 进程 ,这 里 子 进程 由 另外 一 个 小 方块 代表 。 子 进程 开始 和 父 进程 并 行 运 
行 , 父 进程 调用 wait, 内 核 挂 起 父 进 程 直 到 子 进程 结束 。 父 进程 标识 为 wait 的 一 段 暂停 


运行 。 
fork ( ) wait ( ) 


图 8.10. wat 暂 售 父 进 程 直 到 子 进程 结束 


最 终 子 进程 会 结束 任务 并 调用 exit(n)。n 是 0 到 255 的 一 个 数字 。 

当 于 进程 调用 exit ,内 核 唤醒 父 进 程 同时 将 子 进程 传 给 exit HBR. ORM ASI IB E 
(exit) 值 的 动作 由 从 exit 的 括号 到 父 进程 的 箭头 表示 。 这 样 wait 执行 两 个 操作 : 通知 和 
通信 。 

2. 例子 : waitdemol.c iB e 

wattdemol. c 显示 了 子 进 程 调 用 cit b de] b Am wait 返回 父 进程 的 。 





/* waitdemol.c — shows how parent pauses until child finishes 


» / 
H include <stdio.h> 


# define DELAY 2 
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maint } 
1 
int newpid; 
void child code(), parent codel); 


printf("before; mypid is * dn", getpid()); 


if ( (newpid = fork()) == -1) 
perrorí( fork"): 
else if ( newpid == 0) 
Child code(DELAY). 
else 
parent code(newpid); 
| 
j* 
* new process takes a nap and then exits 
x / 
void child_codef int delay) 
{ 
printf( "child *d here. will sleep for *d seconds\n", getpid(), delay); 
sieep( delay) ; 
printf( "child done. about to exit\n"™> ; 
exit(17); 
] 
/* 
* parent waits for child then prints a message 
f 
void parent code(int childpid) 
1 
int wait rv; /* return value fron wait() */ 
wait rv = wait(NULL): 
printf("done waiting for & d. Wait returned; $ din", childpid, wait rv); 


运行 waitdemol, c 的 结果 如 下 : 


5 . /waitdemol 

before: mypid is 10328 

child 10329 here. will sleep for 2 seconds 
child done. about to exit 

do waiting for 10323, Wait returned.10329 


运行 程序 .调整 时 间 , 可 以 发 现 父 进程 总 会 等 到 子 进 程 调用 exit. BH 8.11 演示 了 控制 流 
和 两 个 进程 之 间 的 数据 传输 。 在 父 进程 ,控制 流 始 于 程序 的 开始 ,在 wait HHS. EF 
进程 ,控制 流 始 于 man 函数 的 中 部 ,然后 运行 child code 函数 ,最 后 调用 exit AR. T ute 
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调用 exit 就 像 发 送 一 个 信号 给 父 进程 以 唤醒 人 臣 。 


| parent child 
[maini 
{| fork(); 
) | 
LEPLE wait 处 阻塞， jain duia anni | |ehila_codet) 
然后 在 于 进程 追 出 后 继 ‘| 
qi. 2 | (Oel 
exit(n) ; | y exitinl: 
J P 
parent code() | " parent coda) 
li : 
| int status: int status; 
Y waitl&stathrs! ; | wait(&status); 
i) 





T r a RIP 


图 8. 11 调用 waii() 前 后 的 控制 流 和 进程 向 通信 


waitdemol. c 程序 体现 了 wait 的 两 个 重要 特征 : 

(1) wait 阻塞 调用 它 的 程序 直到 子 进程 结束 

在 这 个 简单 的 程序 中 , 父 进程 阻塞 百 到 子 进程 调用 exjt。 这 一 特征 使 两 个 进程 能 够 同步 
它们 的 行为 、 比 如 , 父 进程 用 fork 创建 一 个 子 进 程 来 对 一 个 文件 排序 ， 父 进程 必须 等 排序 
结束 后 才能 继续 处 理 这 个 文件 。 系 统 调 用 exit 和 wan 是 一 种 协调 这 些 任 务 的 方法 。 

(2) wait 返回 结束 进程 的 PID 

在 这 个 简单 的 程序 中 ,wait 的 返回 值 是 淹 用 exit 的 子 进程 的 PID。 就 像 在 forkdemo2. c 
中 看 到 的 ,一 个 进程 可 以 创建 多 个 子 进 程 。 考 虑 一 个 从 两 个 不 同 的 远程 数据 库 整 合 数据 的 
程序 。 这 个 程序 可 以 使 用 fork 来 创建 两 个 进程 ,一 个 用 来 连接 并 从 数据 库 中 提取 数据 . 另 一 
^ M. d fi CE PESE. MOSES -个 数据 库 提 了 到 来 的 数据 需要 做 些 后 期 处 理 ,而 从 第 二 个 
Si TE PE He NOR i'd dis | AS d BSE BS AER, 

wait 的 返回 值 告诉 父 进程 那个 任务 结束 了 。 这 样 它 就 可 以 继续 有 效 的 处 理 了 ， 

3. 例子: waltdemo2. c——— if f& 

watt 的 目的 之 一 是 通知 父 进程 子 进 程 结束 运行 了 。 它 的 第 二 个 目的 是 告诉 父 进程 子 进 
程 是 如 何 结束 的 。 | 

一 个 进程 以 3 种 方式 (成 功 、 失 败 或 死亡 ) 之 一 结束 。 其 一 ,一 个 进程 可 能 顺利 完成 它 的 
任务 。 按照 Unix RH, ALTA AD RE AA exit(0) 或 者 从 main BFP return 0. 

其 二 ,进程 可 能 失败 。 比 如 进程 可 能 由 于 内 存 耗 尽 而 提前 退出 程序 ， 按 Unix 惯例 , 程 
序 遇 到 问题 而 要 退出 调用 'exit 时 传 给 它 一 个 非 零 的 值 。 程 序 员 可 以 对 不 同 的 错误 分 配 不 同 
的 值 ,手册 中 有 详细 的 描述 。 
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最 后 ,程序 可 能 被 一 个 信号 杀 死 ( 见 第 6 和 第 7 章 )。 信 号 可 能 来 自 键盘 、 介 隔 计 时 冀 、 内 
核 或 者 其 他 进程 。 通常 的 情况 下 .一 个 既 没 有 被 忽略 叉 没 有 被 捷 获 信和 号 会 杀人 至 进程 的 ， 

wait 返回 结束 的 子 进程 的 PID 给 父 进 程 。 父 进程 如 何 知 道子 进程 是 以 何 种 方式 退出 
的 呢 ? 

答案 在 传 给 wai 的 参数 之 中 。 父 进程 调用 wan 时 传 一 个 整 型 变量 地 址 给 项 数 。 AK 
将 子 进 程 的 退出 状态 保存 在 这 个 变量 中 。 如 果子 进程 调用 exit 退出 ,那么 内 核 把 exit 的 返 
回 值 存放 到 这 个 整数 变量 中 ; 如 果 进 程 是 被 杀 死 的 ,那么 内 核 将 信号 序号 存放 在 这 个 变量 
中 。 这 个 整数 由 3 部 分 组 成 一 一 8 个 bit 是 记录 退出 值 ,? 个 bit dioe fa S Hm BT bit 
FASE di Un A b EUR 3E PEE T PEEL core dump), K 8. 12 演示 了 了 于 进程 状态 什 的 3 个 
部 分 : 


exit value E signal number 


child 





图 86.12 子 进 程 状态 值 有 3 部 分 


例子 waitdemo2, c 是 基于 waicdemol,c 的 , 它 显 示 了 子 进程 的 退出 状态 ， 


/* waitdemo2.c - shows how parent gets child status 


*/ 
H include < stadio. h> 
# define DELAYS 


main() 
{ 
uit newp id; 


void child code(), parent code() ; 
printf("before: mypid is % dn", getpid()); 


if ( (newpid = fork()) == -1) 
perror( "fork"); 

else if ( neapid == 0) 
child code(DELAY) ， 


else 
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parent code(newpid); 
} 
fx 
* new process takes a nap and then exits 
x / 
void child code(int delay) 
{ 
printf("child %d here. wil] sleep for $d seconds\n", getpid(), delay); 
sleep(delay); 
printf("child done. about to exit\n"); 
exit(17); 
i 
/* 
* parent waite for child then prints a message 
x/ 
void parent code(int childpid) 
1 
int wait rv; /* return value from wait() x/ 
int child status; 
int high B, low 7, bit 7; 


wait rv 7 wait(&child status); 


printf("done waiting for *d. Wait returned: $d\n", childpid, wait rv); 


F 


high 8 = child status >> 8; fe 1111 1111 0000 0000 x/ 
low 7 = child status & Ox7F; /* 0000 0000 0111 1111 x/ 
bit 7 = child status & 0x80; /* 0000 0006 1000 0000 «/ 


printf("status; exit? *d, sig- $d, core= * din", high 8, 3os 7, bit 7); 


首先 ,让 waitdemo2 EREE. HRS THEA A. 


5 ./waitdemo2 

before. mypid is 10855 

child 10856 here. will sleep for 5 seconds 
child done. about to exit 

done waiting for 10856 . Wait returned. 10856 


status: exit 217, sig=0, core=0 


然后 ,在 后 台 运 行 waitdemo2 ,使 用 Kill( 见 第 ? Eb Ep HERE BE SIGTERM 信号， 


$ ./waitdemc2 & 

$ before: mypid is 10857 

child 10858 here, will sleep for 5 seconds 
kill 10658 
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$ done waiting for 10858, Wait returned: 10858 


status; exit - 0, sig= 15, core=@ .- 


wait O NET. 
wait 
目标 等 待 进程 结束 
A yi i include < sys; types, ho 
| # include < sys/wait. hœ 
& oh m pid. t result = wait(int * statusptr) 
参数 statusptr 子 进 程 的 运行 结果 
返回 和 值 —1 38 IA 
pid 结束 进程 的 进程 id 
相关 内 容 waltpid(2) , wait3(2) m 


wait 系统 函数 挂 起 调用 它 的 进程 直到 得 到 这 个 进程 的 子 进 程 的 一 个 结束 状态 。 结 束 状 
态 是 退出 值 或 者 是 信和 号 序号 。 如 果 有 一 个 子 进程 已 经 退出 或 被 杀 死 ,对 wait 的 调用 立即 返 
E, wait 返回 结束 进程 的 PID. WA statusptr 不 是 NULL, wait 将 退出 状态 或 者 信号 学 号 
复制 到 statusptr 指向 的 整数 中 。 这 个 值 可 以 用 所 sysywait. h> t Hi E tem. 

如 果 调 用 的 进程 没有 子 进 程 也 没有 得 到 终止 状态 值 , 则 wait 返回 一 1。 


8.4.5 小 结 : shell 如 何 运行 程序 


ix — 15 LI fo] E" shell 是 如 何 运 行程 序 的 ?开始 ,现在 已 经 知道 答案 了 ; shell 用 fork 建 
立新 进程 ,用 exec 在 新 进程 中 运行 用 户 指 定 的 程序 ,最 后 shell 用 wait 等 待 新 进程 结束 。 
wait 系统 调用 同时 从 内 核 取得 退出 状态 或 者 信号 序 续 以 告知 子 进 程 是 如 何 结 束 的 。 | 

每 个 Unix shell 都 是 使 用 图 8. 13 所 示 的 模型 .现在 将 这 3 个 系统 调用 组 合 在 一 起 实现 
一 个 真正 的 shell, 


l, 2n .取得 命令 3. ud 4S Pa 5. 得 到 子 进 程 状态 


加 MEM 


4. 运行 新 ”5. 新 程序 。 56. BORFRIÍSAN 
程序 在 运行 





fl 8.13 shell 的 forkO , exec) waiti BER 
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8.5 实现 一 个 shell: psh2.c 


图 8. 14 是 一 个 Unix shell 的 简化 流程 图 。 下 一 个 shell psh2. c 将 使 用 这 个 流程 ， 


— get command 


TY 

| | 

| 一 fork —- NH 

| E * 
| 

MEE | 

| uL exit 


图 8.14 Unix shell Bj ke iP 48 


/* * prompting shell version 2 
* X 
** Solves the 'one- shot! problem of version 1 E. "s 
x % Uses execvp(), but fork()s first so that the 
并 六 shell waits around to perform another command 
x» New problem: shell catches signals. Run vi, press ^c. 


xx / 


i include <=stdio. h> 
f include «signal. h> 


H define MAXARGS 20 /* cmdline args «/ 
+#define ARGLEN 100 /* token length x/ 
main() 
1 
char +* arglist| MAXARGS + 1 |; /* an array of ptrs x/ 
int numarga ; /* index into array «/ 
char argbuf[ ARGLEN}; /* read stuff here »/ 
char * makestring() : /* malloc etc x/ 


numargs = 0; 
while ( numargs < MAXARGS ) 
{ 
printf("Arg[ & d]? ", numargs}; 
if ( fgets(argbuf, ARGLEN, stdin} && x argbuf != '\n' ) 
arglist|numargs tt | = makestring(argbuf); 
else 


1 


if ( numargs => 0 31 /* any args? »/ 


| 
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arglist[numargs!- NULL; /#* close list */ 
execute( arglist ); /* do it «/ 


numargs = 0; /* and reset «/ 


| 


return 0; 


execute( char * argiist| |) 
fx 


+ use fork and execvp and wait to do it 


| 


xf 


} 


int pid, exitstatus; /* of child «/ 


pid = fork(); /* make new process */ 


switch( pid )| 

case —]1: 
perror("fork failed"): 
exit(1): 

case Ü: 
execvp(arglist[0], arglist); /* do it «/ 
perror("execvp failed"); 
exit(1); 

default. 
while( waitt&exitstatus) |= pid) 


f 


printf ("child exited with status * d, & din", 


exitstatus 78, exitstatus&0377) ; 


“agr 


char *x makestring( char * buf ) 


站 外 
其 


* 


1 


trim off newline and create storage for the string 


/ 


char *cp, «malloc(); 


buf[strlen(buf) - 1] = '\o'; 
Cp = malloc( strlen(buf) * 1 )- 
if ( cp == NULL )| /* ar die x/ 
fprintf(stderr, "no memory\n") ， 
exit(1): 


/* trim newline «/ 


/* get memory * / 
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strepy(cp, buf); /* copy chars */ 


return cp; /* return ptr «/ 


测试 一 下 psh2, 看 看 它 是 否 解决 了 只 能 运行 一 条 命令 这 个 问题 ， 


5 ./psh2 

AÁrg[0]? la 

Arg[1]? -1 

Arg|2]? demodir 

Arg 3 ]? 

total 2 

drwxr—-x--—-— 2 bruce users 1024 dul 14 21:02 a 
drwxr- x--7 3 bruce users 1024 Jul 16 03:16 c 
FW d brice users 0 Jul 14 21:03 y 
child exited with status 0,0 

Arg[O]? ps 

Arg [132 

PID TTY TIME CHD 

11616 pts/4 00:00 -00 bash 
. 11548 pts/4 00:00:00 pshZ 

11664 pts/4 00:09:00 ps 

child exited with status 0,0 

Arg[0]? pshl WW! 能 运行 pshl T 


Àrg[ 1]? 

Arg 0]? ps 这 是 pshl HERI! 
Argl 11? 

PiD SEDE TIME CMD 
11616 pts/d 00:00:00 hash 
11548 pts/4 90:00:00 pah? 
11683 pts/4 00:00;00 ps 


child exited with status 0,0 
Arg[ 0]? grep 

Arg|1]? fred 

Arg| 2j? /etc/passwd 

argh 3}? 

child exited with status 1,0 
ArglO]? dE ^D 

Arg[0 |? Arg[ 0j? Arg[ 0]? exit 
Arg[ 177 

execvp failed: No such file or directory 
child exited with status 1,0 
Arg[0]? WC 

$ 
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如 何 做 到 ? 

psh2.c 工作 正常 。 新 的 shell 接受 程序 名 称 、 参 数列 表 、 运 行程 序 、 报 告 结 困 , 然 后 表 重 
新 接受 和 运行 其 他 程序 。psh2.c 缺少 常用 的 shell 的 一 些 修饰 性 功能 .但 可 以 作为 一 个 坚实 
的 基础 开始 了 ，。 

下 一 个 版 本 中 将 做 如 下 改进 : 

CD 让 用 户 可 以 通过 按 下 Ciel - D 或 者 和 输 和 “exit 退出 程序 ; 

(2) 让 用 户 能 够 在 一 行 中 输 和 人 所 有 参数 。 

在 下 一 章 实现 的 版 本 中 加 上 这 些 功能 . 在 那个 版 本 中 ,将 加 上 一 些 变量 和 控制 流程 使 
它 更 像 一 个 编程 语言 

这 之 前 必须 更 正 一 个 严重 的 错误 。 


信号 和 psh2.c 


从 测试 中 可 以 看 到 ,退出 程序 psh? 的 惟一 方法 是 按 Ctrl-C 键 。 如 果 在 psh? 等 待 子 进 
程 结束 时 键入 Ctrl-C 键 会 如 何 呢 ”上 比如: 


$ ./psh2 

Arg| 0}? tr 
Argq(1]? [a- x] 
Arg[2]? [A- Z] 
Arg| 3]? 

hello 

HELLO 

now to press 
NOW TO PRESS 
Ctrl-C 按 下 ^C 
3 


子 进程 结束 ,但 是 shell 也 结束 了 。 按 下 Ctrl- C 所 生成 的 SIGINT 信号 不 但 杀 死 了 运 
fr tr 的 进程 .而 且 杀 死 了 运行 psh2 的 进程 。 为 什么 呢 ? 

键盘 信号 发 给 所 有 连接 的 进程 | 

程序 psh2 和 tr 都 连接 到 终端 (如 图 8.15 所 示 )。 当 按 下 中 断 键 ,ttr 驱动 告诉 内 核 向 所 


uS — me "3 "| HT LUE 73 
ee ' 
-— "m 
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= 
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有 由 这 个 终端 控制 的 进程 发 送 SIGINT 信号 .tr 死 了 .在 我 们 的 程序 里 , psh 也 死 掉 了 ,即使 
它 还 在 等 待 子 进程 的 结束 ， 
如 何 才能 让 shell 不 被 用 户 按 下 的 中 断 或 退出 键 杀 死 ? x BUDE EHE 


8. 6 Ay 用 进程 编程 


为 了 理解 Unix 进程 ,运行 了 ps 命令 ,还 学 习 了 shell 如 何 使 用 fork exit 和 wait 来 控制 
进程 和 运行 程序 。 

在 继续 学 习 下 一 章 有 关 在 shell 中 增加 变量 和 循环 之 前 ,考虑 一 下 函数 和 进程 之 间 的 相 
{LTE . 

]. execvp/exit #48 call/return 

(1) call/return 

一 个 CHR HES BRAM. — IP ER CRT ULYS FRE 25 — 7h ]e8 Le] b 4628 0 — 2 2 X. 
a FA PT E BARBIE SRI. EIS ER CUR E B9 Jey SB AE Tit «IS [8] 89 PR X 
通过 call/return 系统 进行 通信 。 | 

这 种 通过 参数 和 上 返回 值 在 拥有 私有 数据 的 哨 数 间 通 信和 的 神 式 是 结构 化 程序 设计 的 基 
础 。Unix 鼓励 将 这 种 应 用 于 程序 之 内 的 模式 扩展 到 程序 之 间 。 这 种 局 式 可 以 用 图 8. 16 3k 
XR. 





图 8.16 PR ae A EP AA] 


(2) exec/exit 

一 个 C 程序 可 以 fork/exec 另 一 个 程序 ,并 传 给 它 一 些 参数 。 这 个 被 调用 的 程序 执行 一 
定 的 操作 ,然后 通过 exit(n) 来 返回 值 。 调 用 它 的 进程 可 雇 通过 wait( & result) KAM exit 的 
返回 值 。 了 程序 的 exit 返回 值 可 以 在 result 的 8—15 位 之 间 找 到 。 

虹 数 调用 所 用 到 的 堆栈 几乎 是 没有 限制 的 .一 个 被 调用 的 程序 还 可 以 调用 其 他 程序 ， 
一 个 通过 fork/exec 调用 起 来 的 程序 可 以 通过 fork/exec 调用 别 的 程序 。Unix 使 创建 一 个 
新 进程 方便 而 有 旦 快捷 。 用 fork/exit 和 exit/wair 来 调用 程序 和 返回 结果 不 仅 适 用 于 shell. 
Unix 程序 经 常生 设计 成 一 组 子 程序 ,而 不 是 一 个 带 有 很 多 函数 的 大 程序 。 
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由 exec 传递 的 参数 必须 是 字符 串 。 由 于 进程 间 通 信 的 参数 类 型 为 字符 串 ,这 样 就 强迫 
了 了 于 程序 的 通信 也 必须 使 用 文本 作为 参数 类 型 。 几 乎 是 偶然 的 ,这 种 基于 文本 的 程序 接口 
文 持 蜂 平台 的 交互 ,而 这 一 点 非常 重要 。 

2. A Ep X € fork/exec 

全 局 变量 是 有 害 的 , 它 破 坏 了 封装 原则 ,导致 出 人 意料 的 副作用 2 和 难以 维护 的 代码 。 
但 有 时 候 去 掉 全 局 变量 却 更 粳 糕 。 怎 么 才能 居 到 不 将 参数 变 得 复杂 的 情况 下 管理 一 堆 每 个 
大 都 要 用 到 的 变量 ? 尤其 是 必须 将 它们 癌 下 传 斤 层 的 时 候 REOR o ECL RR DR 

Unix 提供 方法 来 建立 全 局 变量 。 环 境 {fenvironment) 是 一 些 传 递 给 进程 的 字符 串 型 变 
BEC. PSA BITE A. EX fork/exec 和 exit/wait 机制 是 一 个 有 用 的 补充 。 下 一 章 将 看 到 
它 如 何 王 作 利 如 何 使 用 它 ， | 


8.7 exit Al exec 的 其 他 细节 


这 一 章 主 要 学 悦 进程 fork execvp 和 wait, 们 是 还 需要 再 多 了 解 一 些 关 于 exit 和 exec 
B). 


8.7.1 进程 死亡 : exit 和 exit 


exit 是 fork 的 逆 操 作 HER UA exit 来 停止 运行 。fork 创建 一 个 进程 ,exit 删除 进 
程 。 基 本 上 是 这 样 。 

exit 刷新 上 所 有 的 流 , 调 用 由 atexit 和 on exit 注册 的 函数 ,执行 当前 系统 定义 的 其 他 与 
exit 相关 的 操作 。 然 后 调用 _exit。 系 统 函 数 _exit 是 一 个 内 核 操 作 , 这 个 操作 处 理 所 有 分 配 
给 这 个 进程 的 肉 存 , 关 闭 所 有 这 个 进程 打开 的 文件 ,释放 所 有 内 核 用 来 管理 和 维护 这 个 进程 
的 数据 结构 。 

子 进程 传 给 exit 的 参数 被 如 和 何 处 理 了 ? 那个 进程 的 弥留 之 言 被 存放 在 内 核 直到 这 个 进 
程 的 父 进程 通过 wait 系统 调用 取 回 这 个 值 。 如 果 父 进程 没有 在 等 这 个 值 ,那么 它 将 被 保存 
在 内 核 真 到 父 进程 调用 wait,; 那 时 内 核 将 通告 这 个 父 进程 子 进 程 的 结束 ,并 转达 于 进程 的 弥 
留 之 言 。 

那些 已 经 死 t 但 是 还 没有 给 exit 赋值 的 进程 被 称 之 为 幽灵 (人 zombie) 进 程 。 很 多 比较 新 
的 版 本 的 ps 列 出 这 些 进 程 并 标记 为 defunct。 

_exit0C) 小 结 如 下 。 

系统 调用 _exit 终止 当前 进程 并 执行 所 有 必须 的 清理 工作 。 这 些 工 作 在 各 个 不 同 版 本 的 
Unix 中 有 些 不 同 , 但 都 包括 以 下 一 些 操作 : 

(D KAA XARA A BRAG. 

(22 将 该 进程 的 PID BH init 进程 的 PID. 

(3) 如 末 父 进程 调用 wait 或 waitpid 来 等 待 子 进 程 结束 , 则 通知 父 进 程 。 

(4) HEER RIA SIGCHLD, 


Q ”有些 人 认为 全 局 变 景 会 学 至 错误 和 和 混乱. 
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_exit 

目标 终止 当前 进程 
Xx H include < unistd. h> 

H include —sidlib. h> 
a Bh ms ui void exil(int status) 
参数 status 返回 值 
返回 值 Ju 
相关 内 容 atexit(3) ,exit( 3) ,on exit(3) 


这 样 , 如 果 父 进程 在 子 进 程 之 前 退出 ,那么 子 进 程 将 能 继续 运行 ,而 不 会 成 为 "孤儿 ”, 它 
们 将 是 int 进程 的 “子女 ”, 这 有 点 像 孤 儿 由 国家 监护 。 注 意 , 就 算 父 进程 设 有 调用 wait ,内核 
也 会 向 它 发 送 SIGCHLD 消息 。 尽 管 对 SIGCHLD 消息 的 默认 处 理 方 法 是 忽略 的 。 如 果 想 
We AIX p BE ,可 以 设置 一 个 处 理 函 数 。 


8.7.2 exec 家 族 


在 已 经 实现 的 shell PAA rP FR. execvp 来 演示 进程 是 如 何 运 行 一 个 程序 的 。execyp 
不 是 一 个 系统 调用 , 它 是 一 个 库 图 数 ,这 个 蚊 数 通过 系统 调用 execve 来 调用 内 核 服 务 。 
execve 中 的 上 代表 环境 人 (envirenment) ,所 以 将 推 沁 到 下 一 章 来 讨论 它 ，。 

还 有 一 些 调用 execve 的 晴 数 也 是 有 用 的 。 下 面 是 这 个 家 族 中 的 一 些 成 员 . 


- execlptftile,argvO,argvl,..., NULL) 


execlp 不 像 execvp 那样 用 一 个 参数 数组 。 相 到 ER main 的 argvL] 中 包括 的 参数 被 简 
单 的 放 在 execlp 的 参数 中 。 例 如 : 


execlp("ls" "ls","— a", "demodir",NBSLI) ; 


以 指定 的 参数 运行 程序 ls。 当 预 先知 道 要 运行 的 命令 和 它 的 参数 时 execlp 是 有 用 的 。 
但 是 在 shell 中 ,这 个 函数 屋 必 人 么 用 ,因为 在 用 户 输入 命令 之 前 不 知道 有 密 少 参数 。 


execl(fullpath,argvO,arqvl,... , NULL) ; 


execlp 和 execvp 中 的 6 代表 路 径 (Cpathy。 这 两 个 函数 在 环境 变量 PATH 中 列 出 的 路 
径 中 查找 由 第 一 个 参数 指定 的 程序 。 如 果 准 确 知道 这 个 文件 的 位 置 ,那么 就 能 够 在 execl 中 
的 第 一 参数 中 指定 它 的 完整 路 径 。 例如: 


execl("/bin/1s","ls","— a", "demodir", NULL) ; 


以 指定 的 参数 来 运行 程序 /binyls。 指 定 程 序 的 准确 位 置 比 运行 execlp 更 快 。 因 为 后 者 
要 在 路 径 中 查找 指定 程序 。 指 定 准 确 路 径 也 比 execlp 安全 。 如 果 环 境 变量 中 有 错误 的 路 径 
列表 ,那么 可 能 运行 错误 的 程序 ， 


execv( fullpath, arglist) 
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除了 不 在 PATH 中 查找 程序 文件 外 ,execv RI execvp 非常 相似 。 第 一 个 参数 必须 是 要 
执行 程序 的 完整 路 径 。 使 用 execv 或 exec! 来 执行 明确 指定 的 程序 比 依赖 安全 的 路 经 列表 
PATH 更 安全 。 因 为 PATH 很 容易 被 恶意 的 用 户 算 改 。 


小 zu 


l. 主要 内 容 

* Unix 通过 将 可 执行 代码 载 人 进程 并 执行 它 来 运行 一 个 程序 。 进 程 是 运行 一 个 程序 
所 需 的 内 存 空 间 和 其 他 资源 的 焦 合 ， 

每 个 运行 中 的 程序 在 自己 的 进程 中 运行 。 每 个 进程 都 有 一 个 惟一 的 进程 D、 所 有 


者 .大 小 及 其 他 属性 。 
。 系统 调用 fork 通过 复制 进程 来 建立 一 个 几乎 和 腺 来 进程 完全 相同 的 副本 进程 。 这 
个 新 建 的 进程 被 称 为 子 进程 。 | 


一 个 程序 通过 调用 exec eS IO TE PA Br ERR P DUET T oF. 
， 一 个 程序 能 通过 调用 weit 来 等 待 子 进程 结束 
。 调用 程序 能 将 一 个 字符 串 列表 传 给 新 程序 的 main 孙 数 。 新 的 程序 能 通过 调用 exit 
来 问 传 一 个 8 位 长 的 值 。 
Unix shell 通过 调用 fork exec 和 wait 来 运行 程序 。 

2. 进一步 的 问题 

shell 运行 程序 ,同时 shell 也 是 -种 编程 语言 。 下 面 将 学 习 shell 的 脚本 语言 。 还 要 看 
看 如 何 修改 程序 以 支持 脚本 、 控 制 逻 辑 和 变量 。 

3. 习题 

8.1 M fork 返回 的 值 能 够 区 分 父 进程 还 是 子 进 程 ? 还 有 其 他 的 办 法 做 到 这 一 点 吗 ? 


8.2 预测 下 面 程序 的 输出 : 
main() 
i 
ant n; 
for(n = 0; n-—10;n-4*) 
i 
printf("my pid = $d, n = %d\n"_ getpid() , n); 


sleep(1); 
if (£ork() t= 0) /* what if these two »/ 
exit(co»; /* lines were removed «/ 


f 
f 


如 果 把 有 注解 的 两 行 删除 ,结果 又 会 如 何 ? 


8.3 ”psh2.c 使 用 了 定 长 的 数组 来 存放 参数 列表 。 和 如何 修改 程序 才能 去 掉 用 户 输入 全 
令 参 数 个 数 的 限制 ? 这 样 的 改动 有 必要 吗 ” 这 就 是 说 , Unix 是 否 限 制 了 exec 可 
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接受 的 参数 长 度 或 个 数 ? 
8.4 考虑 以 下 代码 : 


maint ) 
|. int fd; 
int pid; 
char msgl[ | = "Test123 ..Xn":; 


char msg2| | = "Hello, hello\n"; 


if ( (fd = creat(tesefile, 0644)) 
return 0; 
if ( write(fd, msg1, strlen(msgl) 


return Q: 


if ( (pid = fork()) == -1) 


return Q» 


if ( write(fd, msg2, strlen(msg25) 


return 0: 
close( fd}; 


return 1; 


1 
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— 1) 


- 1) 


测 运 这 个 程序 。 调用 fork 之 后 两 个 进程 都 有 一 个 指向 同一 个 输出 文件 并 且 具 有 
相同 的 当前 位 置 的 文件 描述 符 . EP RAIL ARR? 能 否 从 记录 的 条 数 得 知 


文件 描述 符 利 连接 的 文件 ? 
"E m PIE 


# include << stdic. h > 


maint ) 


5.5 


I 
E 


FILE * fp; 
int pid; 

char msgl| | = “Test 123..\n"; 
char msg2. | = "Hello, helloÀn"; 
if C {fp = 

return Ü; 

fprintf(fp, "% s", 
if ( (pid = fork() 


return ， 


msgl?;: 
== -1} 
fprintf(fp,"*5" msgz) > 
fclose(fp): 
return 1; 
t 


fopen("testfile2", "w")) 


D) 


测试 这 个 程序 。 文 件 中 有 多 少 条 记录 ? 解释 一 下 结果 。 将 这 个 程序 的 输出 与 课 


本 中 的 forkdemol. c 的 输出 比较 一 下 。 
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8.6 编译 并 运行 以 下 程序 : 

main) 
1 
int id; 
if (fork() 1= 0D 
exit(Q); 
for { i=1 ;i-- 10 :1++)1! 
printf("still here.. \n); 
Sleep(i); 
eium 0; 
j 
解释 程序 做 了 些 什 么 ,怎么 工作 的 ,Unix shell 允许 用 户 在 后 台 运 行程 序 。 这 个 程 
序 与 后 台 进 程 有 什么 相似 之 处 ? 
8.7 ”如 果子 进程 运行 失败 ,程序 调用 exit。 调 用 exit 看 起 来 很 极 库 。 为 什么 不 仪 仪 从 
EG A rr a a] (RS? 
4. He 42 3] 
8.8 扩展 waitdemol. ec 的 功能 ,使 之 建立 两 个 进程 ,并 等 待 两 个 进程 痢 结 束 ， | 
进一步 扩展 你 的 程序 使 之 能 从 全 信行 接 受 整 数 。 然 后 程序 创立 该 整数 指定 的 进程 数 。 
分 配 每 个 进程 一 个 随机 的 睡眠 时 间 。 最 后 , 父 进程 报告 每 个 子 进 程 的 退出 。 
8.9 写 个 程序 来 帮助 理解 SIGCHLD, (Pt waitdemo2. c, i E SIGCHLD 和 信号 的 人 处理 
消 数 。 然 后 执行 循环 ,每 一 秒 打 印 一 次 "waiting"。 当 子 进程 退出 ,程序 打印 消息 ， 
报告 退出 原因 然后 退出 。 
8.10 5j — T EUT RS — TIE US SIC PR TELLE SB oe T LITERE a TE 
进程 睡眠 5 秒 钟 ,然后 退出 。 父 进程 设置 SIGCHLD Mia S ERES aM. AJARA 
循环 ,每 秒 打 印 一 次 消息 。 依 号 处 理 画 数 调 用 wait, 然 后 打印 子 进程 的 ID, 最 后 
将 计数 器 增 1。 当 计数 器 达到 建立 的 子 进程 数 时 ,程序 退出 。 月 不 同 数 月 的 子 进 
程 数 来 测试 程序 。 当 闻 进 程 数 很 大 时 程序 可 能 会 丢失 -~ 些 子 进程 授 出 的 消息 ， 
HERR ATASATABE RIG? 有 没有 办 法 解决 ? 

8,11 修改 psh2.c fi zz EHA A “exit” BR SI HER ROB EY 

8.12 当 有 子 进 程 在 运行 时 ,标准 Unix shell AAJ RE P eil HH fj BI 3E ZR IE 


接受 命令 行 时 ,标准 的 Unix shell 如 何 响 应 这 些 信 和 号? 修改 psh2.c, 合 之 像 一 个 
标准 的 shell ARBRE LAE. 
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CL he cua Me NN. "r 
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alil r; typ Seer RE 1 


£u ae 


. it 
i EN Be pw E 
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概念 与 技巧 

* Unix shell 是 一 种 编程 语言 

« AE shell 脚本 语言 ? shell 如 何 处 理 脚本 语言 ? 
* shell 如 和 何 处 理 结构 化 的 工作 ? exit(0) = success 
* 为 什么 需要 shell 变量 以 及 如 何 使 用 shell 变量 

* 什么 是 环境 ? 它 是 如 何 工作 的 ? 

相关 的 系统 调用 

* exit 

* getenv 

相关 命令 


* env 


9.1 shell 编程 


TE shell 中 可 以 运行 程序 ,而 shell 本 身 就 是 一 种 编程 语言 。shell 程序 ,一 般 称 之 为 shell 
脚本 ,是 Unix 的 重要 部 分 ,Unix 的 引导 穆 序 和 很 多 管理 程序 都 使 用 shell 脚本 。 本 章 中 , 首 
先 学 习 shell 的 编程 特征 。 然 后 在 上 一 章 编写 的 shell 程序 中 增加 一 些 特征 ,将 if.. then 控制 
语句 ,局 部 变量 和 全 局 变量 添加 到 要 实现 的 shell 程序 中 。 


9.2 什么 是 以 及 为 什么 要 使 用 shell 脚本 语言 


shell 是 一 个 编程 语言 解释 器 ,这 个 解释 器 解释 从 键盘 输入 的 命令 ,也 解释 存储 在 脚本 中 
的 命令 序列 。 | 


shell HEE & — Bal dp 
shell IAS RE— T- 12: — RIS AE, X811 7T B sk dE imdilix T xdg eT 


一 


。 可 以 用 … 个 shell 脚本 在 一 次 请 求 中 来 执行 多 个 命令 。 下面 是 一 个 例子: 
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ge ar EE Ee al 


# this is called scriptÜ 

itit runs some commands 

ls 

echo the current date/time is . 
date 

echo my name is 


whoami 


前 两 行 是 注释 shell SBR SAHA 3 891. AAA P SPA EDS m. shell 逐条 


执行 命令 直到 文件 末尾 或 者 shell 执行 到 exit AS. 


可 以 把 脚本 文件 名 作为 参数 传 给 shell 来 执行 脚本 : 


S sh scriptÜ 

scriptO scriptl seript2 script3 
the current date/time is 

sun Jul 29 23-29-49 EDT 2001 

my name is 

bruce 


$ 
还 可 以 通过 俊 置 文件 的 执行 权限 ,然后 输入 文件 名 来 执行 脚本 ， 


$ chmod + x scripto 

$ scripto 

scriptů scriptl script? script3 
the current date/time is 

Sun Jul 29 23:31:23 EDT 2001 

my name is 

bruce 


9 


对 于 一 个 脚本 只 需要 执行 一 次 chmoed, 可 执行 位 将 保持 不 变 直 到 下 一 次 再 改变 它 。 用 第 


二 种 方法 ,也 就 是 用 改变 文件 可 执行 属性 的 方法 来 启动 肚 本 会 更 加 方便 。 将 脚本 设置 成 可 
执行 的 ,然后 像 运 行 系统 俞 令 或 自己 编号 的 程序 一 样 来 执行 脚本 。 


将 使 用 哪个 shell? 我 们 将 学 习 和 编写 脚本 的 shell 是 一 个 早期 版 本 的 Unix shell, sh 的 


语法 , 它 被 称 为 B shell(Bourne Shel) ,这 是 根据 编写 这 个 程序 的 人 的 名 字 来 命名 的 。 过 去 
的 几 年 中 有 很 多 不 同 的 shell 被 实现 ,它们 各 有 各 的 特点 或 语法 。 这 里 将 学 习 的 语法 在 大 多 
数 shell 中 是 相同 的 ,包括 sh bash 和 ksh. 


l. sh 的 编程 特征 :变量 .IO ffe if.. then 
shell 脚本 是 真正 的 程序 。 注 意 在 script2 中 体现 的 特点 ; 
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41! /bin/sh 
if script2 : a real program with variables, input, 


+ and control flow 


BOOK = $HOME “phonebook. data 
echo find what name in phonebook 
read NAME 
if grep $ NAME $ BOOK > /tmp/pb. tmp 
then 

echo Entries for $ NAME 

cat /tmp/pb. tmp 
else 

echo No entries for $ NAME 
fi 
rm /tmp/pb. tmp 


下 面 是 seript2 的 输出 ， 


$ ./seript2 

find what name in phonebook 
dave 

Entries for dave 

dave 432 - 6546 

$ ./seript2 

find what name in phonebook 
fran 

Ho entries for fran 

$ cat SHOME/phonebook. data 


ann 222 — 3456 

bob Jàaj— 2242 

carla 123 — 4567 

dave 432 — 6546 

eloise 567-3876 

$ 

BU BER T dir 2 SpA FICK. 
(1) 变量 


脚 相 中 可 以 定义 变量 。 在 script2 中 ,定义 了 名 为 BOOK 和 NAME 两 个 变量 ,并 在 定义 
之 后 使 用 了 它们 ,用 前 弧 $ 来 取得 变量 的 值 。 变 量 各 不 一 定 要 大 写 , 只 是 习惯 上 将 其 大 写 。 

《2) 用 户 输 人 

read 命令 告诉 shell 要 从 标准 输入 中 读 人 一 个 字符 串 。 可 以 使 用 read 来 创建 交 所 的 肢 
本 ,也 可 以 从 文件 或 管道 中 读 和 人 数据 。 

(3) 控制 

这 个 脚本 包括 了 if.. then.. else, .下 控制 语句 。 其 他 的 脚本 控制 语句 还 有 while. case 
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CO 


Al for, 

(4) 环境 

脚本 使 用 一 个 名 为 HOME BEB, HOME REAM ER ROBE. HOME 变量 是 
由 login 程序 设置 的 ,可 以 被 login 进程 的 所 有 子 进 程 使 用 。HOMF 变量 是 多 个 环境 变量 
(environment variabjes) 中 的 一 个 。 这 些 环 境 变 量 记 录 了 个 性 化 设置 。 而 这 些 设置 能 影 啊 很 
多 程序 的 行为 。 比 如 ,TZ 变量 记录 了 当前 的 时 区 。 将 TZ 设置 为 "EST5EDpT" 是 告诉 那些 使 用 
ctime 的 程序 ,比如 date als 一 1, 应 该 总 示 美 国 东 部 上 时间。 本 章 后 麻 会 学 习 环 境 变 量 的 作 
FA RIS TR 

2. Á% shell 的 改进 

ft E— 5E fork.execvp 和 wait 实现 了 -- 个 能 够 创建 进程 和 运行 程序 的 shell, AXE 
中 ,将 对 这 个 shell 懒 一些 改 进 。 首 先 ,将 吉 入 命令 行 和 解析。 这 样 用 户 就 能 够 在 一 行 中 输入 命 
AMAA BRT. RG ,将 控制 语句 if. then 加 人 到 这 个 shell 中 。 最 后 将 加 人 局 部 变量 和 
环境 变量 ， 


9.3 smshl 一 一 -命令 行 解析 


XA a shell 的 第 一 个 改进 是 添加 命令 行 解析 的 功能 。 这 个 版 本 命名 为 smshl.c。 用 户 


find /home — name core - mtime +3 - print 


FA IG ear ey as ST oe BE A Re execvyP。 程 序 主要 流程 吉 图 9.1 所 示 。 
对 psh2. c 的 改进 包括 将 命令 行 分 解 成 参数 数组 ,在 shell 中 忽略 信号 SIGINT fI SIGQUIT, 
但 是 在 子 进 程 中 恢复 对 信和 号 SIGINT 和 SIGQUIT 的 默认 操作 ,人 允许 用 户 通 过 按 表 示 结 束 文 
£t ES Ctrl- D KRH., 











| | 
N d 


Bl9.1 一 个 有 信号 , 通 出 和 解析 的 shell 


ignore signals 
—  -—7* get command 一 一 —— — exit 
| split line 
| 

| lork ce 

| 
| wait enable signals 
| execvp 
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shell 的 主 畏 数 如 下 : 


int maint } 


{ 


char * cmdline, * prompt, * * arglist; 


int result; 


void setup); 


prompt = DFL PROMPT ; 
setup(): 


while ( (cmdline = next cmd(prompt, stdin)) |= NULL 2| 


if ( (arglist = splitline(cmdline)) ! = NULL | 


result = execute(arglist); 


freelist(arglist); 
j 


free(cmdline); 


} 


return 0; 


} 
3 个 晒 数 的 解释 如 下 。 


(1) next. cmd 


next. cmd 从 输入 流 中 读 入 下 一 个 命令 。 它 调用 malloc 来 分 配 内 存 以 接受 任意 长 度 的 
命令 行 。 磁 到 文件 结束 符 , 它 返回 NULL. 


(2) splitline 


splitline 将 一 个 字符 上 分 解 为 字符 串 数 组 ,并 返回 这 个 数组 。 它 调用 malloc 来 分 配 肉 存 
以 接受 任意 参数 个 数 的 命令 行 ， 这 个 数组 由 NULL 标记 结束 。 


(3) execute 


execute 使 用 fork execvp 和 wait 来 运行 一 个 命令 。exercute 返回 命令 的 结束 状态 ， 
smshl 由 3 个 文件 组 成 :smshl.c.splitiine. c 和 execute. c。 用 以 下 命令 来 编译 和 运行 这 


pts/4 
pts/4 


TIME 

00:06 -00 
06 :00 : 00 
00:00-00 


个 程序 ， 
$ ca smshi.c splitline.c exacute.c - o smshl 
5 ./sashl 
ps -f 
UID PID FPID E STIME 
bruce 23203 23189 Q0 Jui29 
bruce 25383 23203 0 08.23 
bruce 25385 25383 0 08:23 


> 在 这 里 按 Ctrl-D 


pts/4 


CMD 
bash 
./smshi 
ps -f 


注意 ps 一 { 是 . /smshl 的 子 进 程 。 /smshl 是 bash 的 子 进 程 。 下 面 是 smshl. 的 代码 . 
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jw smshl.c small- shell version i 
dex first really useful version after prompting shell 
Dza this one parses the command line into strings 
He uses fork, exec, wait, and ignores signals 
ef 


H include << stdio.h> 

H include <istdlib. h> 
H include <unistd.h> 
i include «signal. h> 


# include “sash, h" 


# define DFL PROMPT ">" 


int main() 


| 


char * cmdline, * prompt, + * arglist; 
int result: 
void setup(); 


prompt = DFL PROMPT , 
setup); 


while ( (cmdline = next cmd(prompt, stdin)) |= NULL ){ 
if ( (arglist = splitline(cmdline)) | = NULL | 


result = execute(arglist): 
freelist(arglist); 

| 

free(cmdline).: 


f 


return 0; 


void setup() 
/* 
* purpose: initialize shell 
* returns: nothing. calls fatal() if trouble 
x/ 
1 
signal (SIGINT, SIG IGN); 
signal(SIGQUIT, SIG IGN); 
| 


void fatal(char * sl, char * s2, int n) 
{ 
fprintf(stderr, "Error. $s, sin", sl, s2); 


exit(n); 
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ch ew 


直面 是 execute, c HALE; 


/* execute.c — code used by small shell to execute commands x / 


H include + stdio.h— 

HS include ~ stdlib. bh 
# include <lunistd. h> 
4 include «signal. h> 


# include  «sys/wait.h- 


int execute(char * argv[ |) 
fy 
* purpose; run a program passing it arguments 
x returns; status returned via wait, or — 1 on error 


* errors: — l on fork() or wait() errors 


« / 
i 
int pid ; 
int child info = ~i- 
if《 argv[0] == NULL) /* nothing succeeds; 
return 0; 
if ( (pid = fork()) == -1) 


perror( "fork™) ; 
else if ( pid == 0 }{ 
signal(SIGINT, SIG DFL); 
signal(SIGQUIT, SIG DFL); 
execvp(argv|0,, argv}; 
perror( "cannot execute command"); 
exit(1); 
| 
else i 
if ( wait(&child info) == - 1) 
perror( wait"): 
I 


return child info; 


FER splitline. c 的 代码 ， 


/* splitline.c — commmand reading and parsing functions for smsh 
* 
x char * next cmd(char * prompt, FILE » fp) — get next command 


* char ** splitline(char * str); - parse a string 
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x / 


E include <stdio.h> 
+ include  «stdlib.h- 
# include «< string. K> 


i include "smesh. h" 


char * next cmd(char * prompt, FILE x fp) 
/* 
* purpose: read next command line from fp 
x returns: dynamically allocated string holding command line 
* errors. NULL at EOF (not really an error) 
* calls fatal from emalloc() 


* notes; allocates space in BUFSIZ chunks, 


xf 

| 
char * buf ; /* the buffer x/ 
int bufspace = Q; /* total size x/ 
int pos = 0; /* current position x/ 
int C: /* input char x/ 
printf("$ s", prompt): /* prompt user */ 


while( ( c = getcCfp)) t= EOF) { 


/* need space? +’ 
if( post+ 1 “>= bufspace )i /* 1 For XO x; 
if ( bufspace == 0) /* y: Ist time «/ 
buf = emalloc(BUFSIZ); 
elsé* or expand «/ 
buf = ereailoc(buf ,bufspace + AUFSIZ) > 
bufspace += BUFSIZ; /* update size x/ 


一 .一 


/* end of command? x/ 
if Ce == iin’) 
break ; 


/* no, add to buffer x/ 
buf[pos++ | = c; 

j 

if(c == EOF && pos == 0) /* EOF and no input */ 
returni NULL; /* say so »/ 

buf[pos] = '0'; | 


return buf; 
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^* splitline ( parse a line into an array of strings ) 


wef 
H define is delím(x) ((x) == "(i (x) == Ato 


char x splitline(char =» line) 
/* 
* purpose: split a line into array of white 一 space separated tokens 
* returns;a NULL - terminated array of pointers to copies of the 
x tokens or NULL if line if no tokens on the line 
* action; traverse the array, locate strings, make copies 


* note: strtok() could work, but we may want to add quotes later 
“/ 


char  * newstr(): 


char ** ards ; 


int apots = 0; /* spots in table #/ 
int bufspace = 0; | /* bytes in table «x/ 
int argnum = 9; /* slots used */ 
char * cp = line; /* pos in string xf 


char * start; 


int len; 

if ( line == NULL ) /* handle special casex/ 
return NULL; 

args = enalioc(BUFSIZ): /* initialize array*/ 

bufspace = BUFSIZ; 

spots = BUFSIZ/sizeof(char +); 


while( «cp f= 'XO') 
i 


while ( is delim( * cp) } /* skip leading spaces  x/ 
cp*tt; 

if C «cp == "yo" ) /* quit at end-o- string +*/ 
break; 


/* make sure the array has room ( +1 for NULL) «/ 
if ( argnum t 1 >= spots j| 
args = erealloc(args,bufspace + BUFSIZ), 
bufspace += RUFSIZ; 
spots += (BUFSIZ/sizeof(char * ))- 
} 


/* mark start, then find end of word »/ 
start = cp; 
len = 1; 


F 


while ( #++cp l= DO && ! (is delim( * ap)) > 
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len t* . 
args{argnum++ | = newstr(start, len); 
} 
args| argnum] = NULL; 
return args; 


f 
fe 


+ purpose; constructor for strings 
* returns: a string, never NULL 
x / 

char *» newstr(char * s5, int 1) 

{ 


char + ry = emalloc(l-t 1); 


rv[1] = 10+; 


sLrncpy(rv, s, l); 


f P 


return rv; 


void freelistí(char »«* list) 
ik 
* purpose; free the list returned by splitline 
* returns: nothing 
* action: free all strings in list and then free the list 
xf 
i 
char  **cp = list; 
while( x cp? 
free(xcp++}: 
free( list); 
j 


void * emalloc(size t n) 
t 


void ¥ rv ; 
if ( (rv = malloc(n)? == NULL) 
fatal("out of memory" "" 1): 
return rv; 
} 
void * erealloc(void x p, size t n) 
| 
void * rv; 
if ( (rv = realloc(p,n)) == NULL ) 
fatal("realloc() failed","",1); 


return rv; 
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j 
下 面 是 smsh. h 的 代码 ， 


i define YES 1 
# define NO 0 


char  * next_cmd(); 

char  ** splitline(char +); 

void freelist(char ** 9); 

void x emalloc(size Ej; 

void x erealloc(void * , size t); 
int execute(char s*); 


void fatal(char < , char * , int); 


关于 smshl 的 解释 
smshl HE psh2 要 好 用 很 多 , 收 进 的 方面 主要 包括 以 下 一 些 : 
OD -- 行 多 个 命令 
通常 的 shell 允许 用 分 号 分 隔 命令 ,这 样 用 户 就 可 以 在 一 行 中 输入 多 个 命令 本 


ls demodir; ps — f ; date 

(2) 后 台 进 程 

通常 的 shell RITA RRS MBB LSS SRN Bea. 
find /home — name core print & 


EKARRI- T RIT ENCORE — AOE. KSC o MK I] Bos SE xD ERE RI SEXO CE 
结束 ,但 已 经 可 以 在 提示 符 后 输 人 俞 令 并 运行 其 他 进程 了 。 这 听 起 来 有 点 复杂 ,实际 上 实现 
是 非常 简单 。 看 看 流程 图 , 想 想 是 旭 何 不 等 待命 令 结 束 向 返 加 提示 符 的 。 想 法 很 简单 而 日 
漂亮 ,但 是 要 处 理 信和 导 和 防止 僵尸 (Zombies) 进 程 , 这 有 点 像 惊 险 片 。 

(3) 3E HB tr 

XE 7$ 99 shell 允许 用 广 通 过 输入 exit 来 退出 shell. exit 命令 接受 一 个 整数 和 套数 ,比如 
exit 3, 这 种 情况 下 ,这 个 数字 被 作为 参数 传 给 exit HR. 


9.4 shell 中 的 流程 控制 


对 原 有 的 shell 的 第 2 个 改进 是 增加 if. . then 控制 语句 。 
9.4.1 if iE f) Ed A 
shell 提供 诗 控 制 语 句 。 假 设 你 计划 每 周 五 做 磁盘 备份 ， 考 虑 -下 以 下 例子 ， 


if date|grep Fri 
then 
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echo time for backup. Insert tape and press enter 
read x 
tar cvf /dev/tape /home 

fi 


shell 中 的 这 庄 名 的 作用 与 其 他 语言 的 证 语句 相同 ;条 件 检测 。 如 果 条 件 的 秆 为 正 , 则 有 
一 部 分 代码 被 执行 。 在 shell 中 ,条件 是 一 个 命令 ,返回 正 值 意味 着 命令 运行 成 功 。 

在 例子 中 ,命令 是 date| grep Fri, 这 个 命令 在 date 的 输出 字符 串 中 查找 "Fri 字符 囊 ,如 
” 果 找 到 则 命令 成 功 ,否则 命令 和 失败。 程序 是 如 合 表 示 成 功 的 呢 ? 

C1) exi (ORR RI 

grep AFRA PAR exit(0)? 来 表明 成 功 。 所 有 的 Unix 程序 都 遵从 以 0 退出 表明 成 功 这 
一 惯例 。 比 如 ,diff 命令 用 来 比较 两 个 文本 文件 。 如 果 两 个 文件 相同 ,diff R E o 以 表明 成 
功 。 类 似 地 ,mv、cp 和 rm 痢 以 相同 的 方式 表明 成 功 。 租 本 中 的 if. then 语句 基于 以 0 退出 
表示 成 切 这 个 假设 ， 

(2) TE else 的 二 语句 

一 个 让 语句 可 局 有 else 部 分 ,比如 : 


ls 

who 

if diff filel filel. bak 

then 
echo no differences found, removing backup 
rm filel.bak 

else 
echo backup differs, making it read - only 
chmod - w filel, bak 

Iz 

date 


else 部 分 就 像 then 部 分 一 样 ,可 以 包含 任意 数量 的 命令 ,包括 其 他 的 if. then 语句 ，。 
语句 还 有 另 一 个 特征 。 如 果 计 后 的 条 件 是 一 系列 的 命令 ,那么 最 后 一 个 命令 的 exit i 
被 用 必 这 个 语句 换 的 条 件 值 ,并 由 此 来 汝 和 定 条 件 是 否 成 立 。 


9.4.2 这 是 如 何 工作 的 


if 语句 的 工作 流程 主要 如 下 。 

CD shell 运行 让 之 后 的 命令 。 

(2) shell fg mr H9 exit RA. 

(3) exit 的 状态 为 0 意味 着 成 功 , 非 0 意味 着 失败 。 
《4) 如 果 成 功 ,shell 执行 then 部 分 的 代码 。 

(5) 如果 失 败 shell 执行 else 部 分 的 代码 。 

(60 AS bd 块 的 结束 。 
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9.4.3 在 smsh 中 增加 评 


现在 已 经 知道 i[ 控制 语句 做 什么 ,也 知道 它 是 如 何 寺 作 的 。 那 么 如 何在 shell 中 增加 if 
iE Aa] WE 2 

这 里 已 经 知道 如 何 运行 ~- 个 命令 一 一 调用 cxecute。 也 知道 如 何 检 查 一 个 程序 的 退出 状 
态 一 - -从 wait BHP. GH 这 之 后 命令 的 结果 存放 在 一 些 变 量 中 ,然后 要 知道 语 面 
读 人 的 命令 是 在 then 块 中 ,还 是 else 块 中 。 最 后 还 得 确保 在 计 之 后 恋人 then, 

(1) 增加 一 层 :proecess 

要 实现 这 些 功 能 ,原来 的 模型 就 有 些 太 简单 。smshl 的 控制 流 从 splitline 直接 到 fork. 
每 个 命令 都 被 直接 传 给 exec。 新 的 版 本 中 ,以 计 then 或 者 五 开始 的 行 和 条 件 失败 时 then 语 
ALR Ay HS FATES exec。 添 加 让 语句 后 使 命令 处 理 变 得 复杂 ,所 以 要 写 一 个 名 为 
process 的 函数 来 包含 这 些 复 林 的 人 代码。 修改 后 的 流程 图 如 图 9.2 Br. 


sishl sivish2 
ignore signals ignore signals 
一 一 — get command 一 一 和 exit m- —» gétcommand —— —» exit 
| split line | split line 
| | contro! command? 
| qe ik 一 一 | | 
| wait enable signals | pe fork / —— 一 
| 
|— execv 
| | P | enable signals THE Bit 
| | | | execvp process 
| 4 -————— exit | 





图 9.2 Tk smsb 中 增 吉 流程 控制 


(2) process Wte iF A 

process 通过 寻找 关键 字 ,比如 if then 和 fi 来 管理 脚本 流程 ,在 适当 的 时 候 调 用 fork 和 
exec, process 必须 记录 条 件 命 令 的 绪 果 以 便 能 够 处 理 then 和 else $. 

(3) procss 是 如 何 工作 的 ? FRAG RIM TRA 

process 将 脚本 看 作 一 个 接 一 个 的 代码 区 域 。 第 1 个 区 域 是 then 代码 块 ,第 2 个 是 else 
代码 块 , 第 3 个 是 在 APPR, BRO. 3 所 示 , 对 于 不 同 的 区 域 ,shell 的 处 理 
方法 也 是 不 同 的 。 

考虑 丘 语 名 之 外 的 区 域 ,这 里 称 之 为 中 立 芝 (neutral)。 对 于 这 类 区 域 的 代码 ,简单 地 让 
一 条 ,分 析 一 条 ,执行 一 条 。 

接 下 来 是 在 fü then ZAK BR. PKR, shell 每 执行 一 条 命令 就 记录 下 它 的 退 
出 状态 , 另 一 个 区 域 是 从 then Aj fi 3 else 之 间 , 最 后 一 个 区 域 是 从 else DHL SCARE. 
到 中 立 区 了 ， | 

shell 记录 当前 区 域 类 型 ,还 必须 记录 在 WANT THEN 区 域 中 所 执行 命令 的 结果 。 
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区 域 shell 的 输入 序列 


Is 







Pap lx who 
if diff fiel filel bak 


want-then then 

then-block cau backup 
else-block ees chmod -w filel bak 

中 立 区 date 


图 9. 3 由 不 同 区 域 组 成 的 脚本 


不 同 区 域 的 处 理 方法 是 不 同 的 。 特 定 的 区 域 与 程序 的 特定 状态 联系 在 一 起 。process 通 
过 3 个 睫 数 来 处 理 区 起 问题 。 

(1) is control command ` 

is control. command 返回 一 个 boolean 变量 告诉 process 这 条 命令 是 脚本 语音 的 一 部 分 
还 是 一 条 可 执行 的 命令 ， 

(2) do, control command 

do control command 处 理 关 键 字 if. then Al fi, iA AE ABE BIR FA. 这 个 函 
数 更 新 状态 变量 并 执行 必要 的 操作 。 

《3) ok to execute | 

ok to execute 根据 当前 的 状态 和 和 条件 命令 的 结果 返回 一 个 boolean H , iH HA BER 
“SAY fit. 


9.4.4 smsh2. c: 修 改 后 的 代码 


smsh2. c 是 基于 smshl.c 的 。main 岁数 只 有 一 处 需要 改动 一 一 调用 execute 的 地 方 调 
用 process 了 : 


fee smsh2.c — small- shell version 2 
x small shell that supports command line parsing 
xx and if..then.. else. fi logic (by calling processi)? 
we / 
# include <stdio.h> 
dPinclude <(stdlib. h> 
H include <Cunistd. h> 
# include «simal. h> 
# include <(sys/wait. h> 


# include  "smsh.h" 
# define DFL PROMPT "> " 


int maint) 
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char «cmdline, x prompt, x*-* arglist; 
int result, process(char ** }; 


void setup(O; 


prompt = DFT. PROMPT ; 
setup()> 


while ( (cmdline = next_cmd(prompt, stdind) != NULL | 
if ( (arglist = splitline(cmdline)) | = NULL )| 


result = processtarglist); 
freelist(arglist); 
} 
free( cmdline) ; 
; 


return 0; 


void setupt } 
A 
* purpose; initialize shell 
* returns: nothing, calls fatal() if trouble 
x / 
1 
signal(SIGINT, SIG IGN}; 


signal(SIGQUIT, SIG IGN); 


void fatal(char * s1, char + s2, int n) 
| 
fprintf(stderr,"Error: %s, % s\n", $1, $2); 


exitin); 


还 添加 了 两 个 新 文件 process. c RI controlflow. c; 


/* process.c 
* command processing layer 
x 
* The process(char ** arglist) function is called by the main loop 
* [t sits in front of the execute() function. This layer handles 
x two main classes of processing: 


* a) built- in functions (e.q. exit(), set, =, read, .. ) 


r 


* b) control structures (e.g. if, while, for) 


x ri 


H include  «stdio.h- 
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H include "smsh. h" 


int is contro) command(char + ); 
int do control command(char #» j); 


int ok to execute(); 


int process(char * x args) 
/» 
* purpose: process user command 


* returns; result of processing command 


* details: if a built - in then call appropriate function, if not 


execute() 
* errors: arise from subroutines, handled there 


x 


int rv = 0; 
if ( args[O, == NULL) 
rv = D; 


else if ( is contro] _command(args[0]) ) 
rv — do control command(args); 
else if ( ok to execute() > 
rv - execute(args); 


return rv - 
/* controlflow.c 


x "if" processing is done with two state variabies 
x 1f state and if result 

x / 

# include <stdio.h> 


# include  "smsh.h" 


enum states ( NEUTRAL, WANT THEN, THEN BLOCK } ; 
enum results | SUCCESS, FAIL |; 


static int if state = NEUTRAL; 
static int if result = SUCCESS; 
static int last stat = Q; 


int syn err(char * )- 


int ok to execute() 
/* 


* purpose: determine the shell should execute a command 


* returns: 1 for yes, 0 for no 


* details . if in THEN BLOCK and if result was SUCCESS then yes 


* 275 * 


ewe m sa — 
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x if in THEN BLOCK and if result was FAIL then no 
x if in WANT THEN then syntax error (sh is different) 
*/ 
i 
int rv - 1 : /* default is positive x/ 


if ( if state == WANT THEN | 
syn_err( "then expected"); 


ry = 1; 
else if ( if state == THEN BLOCK && if result == FAIL) 
rv = 0; 


return rv; 


} 


int is control command(char * $} 
/* 
* purpose; boolean to report if the command is a shell control command 
x returns: 0 or 1 
x / 
i 
return (strcmp(s,"if") ==0 || stremp(s,"then") ==0 || 


strcmp(s,"fi") == 0); 


int do control command(char * * args) 
fx 
* purpose: Process "if", "then", "fi" — change state or detect error 
* returns; 0 if ok, — 1 for syntax error 
x / 
1 
char  * cmd = args[0]|: 


int rv = ~le 


r 


if ( strcmp(emd, "if ") == 0 5| 
if ( if state | = NEUTRAL ) 
rv — syn err("if unexpected"). 
else i 
last stat = process(args+ 1); 
if result = (last stat == 0 ? SUCCESS . FAIL); 
if state = WANT THEN; 


i IL. 一 一 一 





”一 一 一 一 一 .一 -一 -一 一 一 一 一 
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else if ( strcmp(cmd, "then"5 == 0 ){ 
if ( if state ! * WANT THEN ) 
rv = syn err("then unexpected"); 
else ! 
if state - THEN BLOCK; 


tm, m 


else if ( stremp(cmd, "f£i") 2-0 | 
if ( if state |= THEN BLOCK } 


rv = syn err( "fi unexpected"). 


else | 
if state = NEUTRAL; 
rv = 0; 
; 
} 
else 


fatal("internal error processing;", cmd, 2); 


return rv. 


f 


int syn err(char x msg) 
/* purpose: handles syntax errors in control structures 
x details: resets state to NEUTRAL 
x returns; - 1 in interactive mode. Should call fatal in scripts 
x / 
| 
if state = NEUTRAL; 
fprintf(stderr, syntax error: % sin", msq); 


return — 1; 


在 controlflow. c 中 ,if 159] B8 else 没有 被 处 埋 , 这 一 部 分 留 作 读者 的 习题 ， 


编译 并 执行 这 个 版 本 : 


S$ cc -o snsh2 smsh2.c splitline,c execute.c process., c controlflow.c 
S ./smshZ 

“> grep lp /etc/passwd 
ip:x:4:7:lp:/var/spool/lpd; 
—- if grep lp ‘etc/passwd 
lpix:4:"7-lp:/var/spool/lpd: 


“> then 
=> echo ok 
ak 


-> fi 


Lit 


be —m 
= 一 一 一 一 一 一 一 —M——  ÀÀ 
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~ if grep pati /etc/ passwd 
“> then 

“> echo ok 

> fi 

— echo ok 

ok 

— then 


syntax error; then unexpected 


做 得 如 何 ? 
看 起 来 做 得 不 错 。 那 么 和 和 常用 的 shell EER X. an fap ue ? 


$ if grep lp /etc/passwd 

s then 

5 echo ok 

$ fi 
lp:x:d;7;lp.:/var/spool/lpd; 
ok 

$ 


这 个 shell 处 理 让 语 名 的 方法 和 刚才 的 实现 有 些 不 同 。 标 准 的 shell ÆA fi pm T 
地 执行 if 语句 块 。 这 是 怎么 司 到 的 妮 ? 为 什么 要 这 么 做 呢 ? 常用 的 shell m Aii E R if 
语 何 ,这 里 的 程序 能 做 适 改 以 支持 舱 套 的 十 庄 句 吗 ? 


9.5 shell 变量 :局 部 和 全 局 


像 其 它 的 程序 语言 一 样 ,Unix shell 也 有 变量 。 能 对 这 些 变量 赋值 ,也 可 从 这 些 变 量 取 
值 ; 列 出 所 有 变量 ,例如 以 下 的 代码 ，: 


$ age-7 # assigning a value 

5 echo 5 age # retrieving a value 

7 

5 echo age i the 5 is required 

age 

$ echo $ aget $ age + purely string operations 
747 

$ read name 4 input from stdin 

Fido 


$ echo hello, 5 name, how are you # can be interpolated 

| hello, fido, how are you 
S ls > $ name. 5 age H used as a part of a command 
$ food = muffins ino spaces in assignment 
food:not found 


5 
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shell RIF MBER ;局 部 变量 和 环境 变量 。 在 前 面 提 到 过 了 , 像 HOME" TZ 这 样 的 
变量 可 以 让 用 户 把 个 性 长 设置 传递 给 程序 ,这些 变量 的 作用 有 点 象 全 局 变量 ,它们 可 以 被 所 
有 shell 的 子 进 程 丰 取 。 本 童 的 后 面 将 深入 了 解 环境 , 现 在 ,只 要 记 住 有 两 类 变量 就 可 以 了 了。 


9.5.1 {HF shell 变量 
前 面 的 例子 演示 了 对 变量 的 太 部 分 操作 。 对 变量 的 操作 和 如下， 


操作 类 型 语 法 +t NM 
DE 峰值 var- value 不 能 有 空格 
7| Fi Svat 
MER unset var 
输入 | read var 也 可 以 read varl varZ... 
51 di AE di set 
全 局 化 export var 





变量 名 是 字符 A~ Za-z.0--98 和 _ 的 组 合 。 第 一 个 字母 不 能 是 数字 。 变量 名 是 大 小 写 
敏感 的 。 

变量 的 值 是 字符 府 。 变 量 都 是 字符 串 类 型 的 ,没有 数值 类 型 的 变量 。 所 有 的 操作 都 是 
TARR. 

列 出 所 有 变量 使 用 set du s set 命令 刚 出 当前 shell 定义 的 所 有 变量 ,例如 : 


5 set 

BASH = /bin/bash 

BASH VERSION » 1.14. 701) 
DISPLAY = :0.0 

RUID = 500 

HOME = “home? /bruce 
HOSTTYPE = 1386 

IFS = 


LANG = en 

LANGUAGE = en 

LD LIBRARY PATH = /usr/lib:/usr/local/lib 
LOGNAME = bruce 

OPTERR = 1 

OPTIND = 1 

OSTYPE = Linux 

PATH= ‘bin: /usr/bin :/usr/X11R6/bin : :/us&r/local/bin./home2/bruce/bin 
PPID = 30928 

PS4 = + 

PWD = “home? bruce, projs/ubook/ src/ch09 
SHELL = ‘bin/bash 
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SHLVL = 2 

TERM = xterm ~ color 
UiD = 500 
USER = bruce 

om /binfvi 

age = 7 


name = fido 
这 个 列表 中 包括 很 才 在 登录 时 设置 的 变量 UELUT Be eee 
9.5.2 变量 的 存储 


要 在 shell 里 增加 变量 ,必须 有 个 地 方 能 存放 这 些 变 量 的 名 称 和 值 ,而 且 这 个 变量 存储 系 
统 必 须 能 够 分 辩 局 部 和 全 局 变量 . 下 面 是 这 个 存储 系统 的 抽象 宰 型 


(1) 模型 
变量 fi 是 否 为 全 局 变量 ? 
data "phonebook. dat" | n 
HOME " / homez / f ido" y 
TERM "EIOBI" 


(2) 接口 《部 分 ) 

VLstoreCchar * var,char * val) W% ip € £m var— val 

VLockuptchar * var) 取得 var 的 值 

VList 输出 列表 到 stdout 

(3) 实现 

可 以 用 链表 ,hash 表 , 树 或 者 是 几乎 任何 数据 结构 来 实现 它 。 作 为 第 一 个 版 本 ,用 一 个 
结构 数组 ,其 中 的 每 个 变量 是 这 样 的 结构 ， 


struct var! 
char * str; /*name = val strings; 
int global; /*&à booleans / 

be 


static struct var Lab] MAXVARS |; 








如 图 9. 4 BRAK, 
9.5.3 增加 变量 命令 : Built-ins 


已 经 有 地 方 存放 变 景 了 ,但 还 要 增加 给 变 
量 赋值 . 列 出 所 有 变量 和 获取 变量 值 的 命令 。 
这 就 是 说 ,在 这 个 sheli 中 ,用户 应 该 能 够 输入 ， 


~> TERM = xterm 


图 9.4 shel 变量 的 存储 方式 
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- get 
—-echo § TERM 


set 是 shell 的 一 个 命令 ,而 不 是 一 个 由 shell B47 HARTE XX A (C :f{ 和 then ix de XE 
Hi shell ACR RE, 为 了 将 set 与 要 被 执行 的 程序 区 分 开 , 将 set 设置 为 内 置 (built 一 in) 
的 命令 。 

命令 varname= value 告诉 shell 在 变量 表 里 涨 加 一 项 ,赋值 诸 人 名 也 是 内 置 的 命令 。 

为 了 增 如 内 置 的 命令 到 这 个 shell 中 ,需要 对 流程 图 做 另外 的 一 些 修 改 。 在 调用 fork 和 
exec 之 前 必须 先 看 看 命 令 是 洁 是 shell 内 置 的 命令 ,如 图 9.5 所 示 。 


smsh3 





ignore signals 
Fr 一 一 一 get command — —» exit 
| split line 
y 
|- 一 一 — control command? 
| n 
y e n 

| r— Built-in? — 
| do built-in pos fork — 一 

| | 
广 — wait enable signals 
| | execvp 
人 | exit 





F]9.5 mj smsh PRAIA Eti 


修改 process 图 数 ,使 之 在 调用 fork/exec Zz Bip Fa dk Jed 2g Pj RH GA: 


if ( args| 0] == NULL) 
rv = 0; 
else if ( is control command(arügs|0]? > 
rv = do control command(args); 
else if ( ok to execute(? )1 
if ( |! builtin command(args,&rv) ) 
rv = execute(args); 


f 


新 的 函数 builtin_command 将 检查 和 和 执行 和 内置 命 令 合并 在 一 起 。 变 量 rv 用 来 标识 状 
AS + builtin_command 返回 一 个 布尔 值 ,并 修改 状态 变量 rv, 
builtin, c 的 代码 如 下 ， 


/* builtin.c 
* contains the switch and the functions for builtin commands 


x/ 


a ee M —— a ——— -— rw i € M LA 一 一 一 一 - -一 一 一 一 一 -上 aum. SS ee 


. Unix/Linux Ag ££ 3: BE Ré 


H include  «stdio.h-— 


} include «string. hi> 


# include «ctype. h> 
# include "smsh. b" 


# include  "varlib.h" 


int assigníchar #); 
int okname(char * ); 


int builtin command(char ** args, int x resultp) 


FP 


/* 


* purpose: run a builtin command 


x returns: 1 if args|0] is builtin, 0 if not 


x details: test args| 0] against all known built - ins. 


x! 


4 


int rv = Q 


if ( stremp(argsi 0 ], "set") == 0); 
VLlistO; 
x resultp = 0; 


else if ( strchr(args[0], '=') ! - NULL 21 
* resultp = assign(args| 0 D; 
if € xresultp!-» -1) 


! 
else if ( stremp(args|0], "export") == 0 }{ 
if € argsL1 ! » NULL && okname(args[1]) ) 
x resultp = VLexport(args|1]); | 
eise 


* resultp - 1; 


return rv: 


int assign(char * str) 


/* 





Call functions 


/* 'set' command? »/ 


/* assignment cmd «/ 


/* x-y7 123 not ok x/ 


* purpose; execute name = val AND ensure that name is legal 
* returns; — I for illegal ival, or result of VLstore 
* warning: modifies the string, but retores it to normal 


xj 


char  *cp; 


ra— rarm 


1a am oe sr 
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BL. IW x 

cp = strchr(str,'- '); 

* Cp 三 ‘Or; 

ry = ( okname(str) ? VLstore(str,cp t1) ; = 1 »; 
* cp = {= e. 


; 
int okname(char * str) 
i 
* purpose: determines if a string is a legal variable name 
* returns: 0 for no, 1 for yes 
wr 
| 
char  *cp; 


for(cp = str; sep; cp-- 34 

if ( Cisdigit( * cp) && op == str) | | ! (isalnum( * cp) | | *cCcp--' ? ) 
return 0; 

} 


return ( cp ! = str );/* no empty strings, either «/ 


9.5.4 效果 如 何 


编译 并 运行 改进 后 的 程序 ， 


$ cc -o gmsh3.co smsh2.c splitline.c execute. c process2.c 4 
controlflow.c builtin.c varlib.c 
5 .f/smsh3 
>> set 
>> day = monday 
> temp = 75 
TZ = CST6CDT 
~X.Y=zZz 
cannol execute command:No such file or directory 
> set | 
day = monday 
temp = 75 
TZ = CST6CDT 
— date 
Tue Jul 31 11:56:59 EDT 2001 
2- echo $ temp, $ day 
$ temp, $ day 


OC OC 
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下 


CD 已 经 可 以 正常 工作 了 | 

这 里 的 shell 现存 支持 变量 了 ,能够 给 变量 赋值 ,也 可 以 列 出 当前 的 变量 ,程序 甚至 会 检 
查 不 合法 的 变量 名 ,不 会 将 这 些 名 字 作 为 程序 名 来 处 理 。 

(2) TZ 没有 传 给 Date 

从 这 里 的 例子 看 出 还 有 两 件 事 要 做 。 先 将 变量 TZ 的 值 设 为 美国 中 部 时 间 (U. S. 
central time) ,但 是 date 命令 报告 的 还 是 美国 东部 时 间 。 前 面 说 过 ,变量 TZ 是 程序 运行 环 
境 的 一 部 分 , 它 的 值 应 该 从 父 进程 传 给 子 进程 ,这 如 何 才 能 实现 呢 ? 这 里 的 shell 如 何 才能 把 
变量 放 到 环境 中 使 它 的 子 进程 能 够 访问 得 到 ? 所 以 , 接 下 来 将 讨论 环境 。 

(3) 变量 $ temp 和 $ day 的 值 没有 证 正确 最 示 

刚才 的 测试 表明 这 两 个 变量 的 值 没 有 被 shell 正确 显示 ,也 就 是 说 , 当 shell 在 处 理 echo 
$ temp. $ day 时 没有 用 变量 的 值 替换 变量 名 。 这 些 变量 是 shell 的 局 部 变量 ,echo 命令 不 
知道 这 些 变量 的 值 , 所 以 shell 在 执行 外 部 程序 之 前 必须 进行 变量 替换 。 本 章 的 末 屁 将 会 再 
探究 这 个 问题 。 


9.6 环境 :个 性 化 设置 


人 们 襄 欢 按照 自己 的 诗 好 设置 自己 的 电脑 ,有 些 人 吝 欢 用 风景 画作 桌面 ,而 其 他 一 些 人 
可 能 更 喜欢 纯色 的 谋面 ,有 些 人 喜欢 用 emacs 来 编辑 文本 ,而 有 些 人 喜欢 vis Unix 允许 用 户 
在 称 之 为 环境 (environment) 的 地 方 以 变量 的 形式 存放 这 些 设置 。 每 个 用 户 有 一 个 惟一 的 主 
目录 用户 名 、 邮 件 文件 . 终 疗 类 型 和 育 欢 用 的 编辑 器 ,很 多 个 性 化 的 设置 由 环境 中 的 变量 
id. 

很 多 程序 的 行为 基于 这 些 设置 , 比 如 ,运行 script3 ,可 以 春 到 date 根据 TZ 值 的 不 同 显 
ah AS TIRES fe TK : 


#! /hin/sh 
4 script3 一 shows how an environment variable is passed to commands 
i TZ is time zone, affect things like date, and ls - 1 
# 
echo "The time in BosLon is" 
TZ = ESTSEDT 
export TZ # add TZ to the environment 
date H date uses the value in TZ 
echo "The time in Chicago is" 
Tz = CST6CDT 
date 
echo "The time in LA is" 
TZ = PSTBPDT 
date 


环境 不 是 shell 的 一 部 分 。 但 是 shell 包括 一 些 可 以 让 用 户 读 取 和 修改 环境 的 命令 。 一 
如 既往 , 沈 颇具 环境 做 些 什 么 ,然后 学 习 它 是 如 何 工作 的 ,最 后 把 它 加 到 实现 的 代码 中 ， 
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9.6.1 使 用 环境 


i. 列 出 环境 
env 命令 列 出 当前 所 有 环境 设置 ， 


S env 

LOGNAME = bruce 

LD LIBRARY PATH = /usr/lib:/usr/local/lib 

TERM = xterm 一 color 

HOSTTYPE = 1386 

PATH = /bin:/usr/bin:/usr/X1llR6/bin:/usr/local/bin:/home2/bruce/bin 
HOME = /home2 /bruce | 
SHELL = /bin/bash 

USER = bruce 

LANGUAGE - en 

DISPLAY .0.0 

LANG = en 

_ = /usr/bin/env 


SHLVL = 2 


env 是 一 个 普通 的 程序 ,而 不 是 shell ABN RS. RBA He SH (B SR SEE ELE 
用 ,比如 ,LANG 变量 被 要 显示 信息 或 消息 的 程序 使 用 ,一 个 浏览 器 可 以 用 这 个 变量 的 值 来 
EE FE A A ty AF SE ABD IM. DISPLAY 告诉 XWindows AT HST FT BC TERM 告诉 
curses(GUI bh 38 P (i FR Bi — £R BE ae Pe TRS. 

2. 更 新 环境 

(1? var- value 

通过 对 变量 赋值 就 可 以 更 新 环境 设置 。 oe a een me eT Ot 可 以 通 
过 设置 LANG 一 fr 来 启用 法 语 。 

(2) export var 

使 用 shell 内 置 的 命令 export [o ERE 25 DX H3 46 EE. 如果 var 是 一 个 局 部 变量 ,那么 
将 被 添加 到 环境 里 。 如 果 var 不 存在 ,shell 会 创建 一 个 。bash 允许 通过 用 export var— 
value 将 创建 和 输出 合并 为 一 步 。 

3. 在 已 程序 中 读 入 环境 

EHEER C ERA getenv 也 可 以 得 到 环境 变量 的 值 ,比如 : 


i include —stdlib. h> 
mainí() 
i 
char *cp = qgetenv( "LANG") ; 
if (cp |= NULL && stremp(cp , "fr") == 0) 
printf("BonjourXn"); 


else 
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i er op $ 





printf( "HeiloXn"); 


9.6.2 什么 是 环境 以 及 它 是 如 何 工 作 的 


环境 是 每 个 程序 都 可 以 存 取 的 一 个 字符 串 数 组 ,如 图 9.6 所 示 。 每 个 数 纽 中 的 字符 串 都 
LA var- value 这 样 的 形式 出 再, 数组 的 地 址 被 存放 在 一 个 名 为 environ 的 全 局 变量 里 。 环 境 
MÆ environ 指向 的 字符 串 数 组 , 读 环境 就 是 读 这 个 字符 串 数 组 ,改变 环境 就 是 改变 字符 串 、 
改变 这 个 数组 中 的 指针 或 者 将 这 个 全 局 指针 握 疝 其 他 数组 ， 


environ 








TERM=vtl 00 


TZ=ESTSEDT 


PATH-/hin:/usr/bin 






HOME.=/users/bub 





图 93.8 环境 是 一 个 指向 字符 串 的 指 财 数组 


1. 一 个 简单 的 钢 子 
showenv. c 的 功能 就 像 合 令 env: 


/* Showenv.c - shows how to read and print the environment 


xf 


extern char ` ** environ; /* points to the array of strings */' 


maint) 


i 


int i; 


for( i = 0; environ|il ; i== ) 


printf(" $ s\n", environ[i]); 


1 


changeenv, c 改变 环境 ,然后 运行 env: 


/* changeenv.c 一 shows how to change the environment 


* note: calls "env" to display its new settings 
x/ 
# include-stdio.h— 


extern char *# environ; 
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nain) 


( 
char « table[3]; 


table[0) = “TERM = vt100"; /* £11) the table «/ 
rable[1] = "HOME = /on/the/range"; 
table[2] = 0; 
enviran = table; /* point to that table »/ 
execip( "env", "env", NULL); /* exec a program * 

} 

BN PUE 

5 ./chnngeenv 

TERM = vt100 

HOME = /on/the/range 


$ 


仔细 看 看 程序 。 在 程序 changeenv Pill E— S$ FF 88 9| ,然后 调用 execlp 来 运行 另 一 
个 程序 env。 第 二 个 程序 能 够 读 到 这 个 字符 串 列 表 ,也 就 是 赔 通过 某 些 方法 ,将 这 个 数组 从 
第 一 个 程序 空间 复制 到 第 二 个 程序 空间 了 。 

2. 但 是 exec 清除 了 所 有 的 数据 1 

在 讨论 exec 系统 阅 用 时 候 知 道 , 对 它 的 泣 用 就 像 换 脑 , 州 目 标 程 序 的 代码 和 数据 替换 凋 
用 程序 的 代码 和 数据 .但 是 environ 指针 指向 的 数组 是 惟一 的 例外 , 当 内 核 执行 系统 调用 
execve 时 , 它 将 数组 和 字符 品 复 制 到 新 的 程序 的 数据 空间 ,如 图 9.7 Poo. 


environ 


fork ( ) 


| 





FH PABA | 
相间 的 代码 ， 数 据 | 


fflenviron . 一 un 






图 9.7 environ 指向 的 数据 在 执行 execC) 时 被 复制 


在 生成 子 进 程 的 过 程 中 ,观察 environ 数组 的 变化 。 可 以 看 到 ,fork 完整 地 复制 父 进程 ， 
包括 代码 和 数据 ,数据 中 包括 了 环境 。exec 清除 原来 进程 中 的 所 有 代码 和 数据 , 插 人 新 程序 
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的 代码 和 数据 。 只 有 通过 参数 cxecvp 传递 的 数据 和 存储 在 环境 中 的 字符 串 可 以 众 旧 程序 复 
制 到 新 程序 。 

3. 了 进程 不 能 修改 父 进程 的 环境 

子 程 序 中 环境 的 设置 是 父 进程 环境 的 复 本 , 子 进程 不 能 修改 父 进程 的 环境 。 因 为 在 进 
程 调用 fork 和 exec 时 整个 坏 境 都 被 自动 的 复制 了 .所 以 通过 环境 来 传递 数据 比较 方 使 
快捷 ， 


9.6.3 在 smsh 中 增加 环境 处 理 


现在 可 以 修改 shell 程序 使 其 能 够 存 取 环境 变量 。 首先 ,shell 要 将 环境 中 的 变量 添加 到 
ACH di XB. ARE Shell 的 几 户 要 能 够 修改 和 添加 环境 变量 。 

1， 存 取 环 境 变 量 

已 经 知道 环境 的 结构 ,而 震 还 有 一 组 函数 向 变量 列表 添加 变量 。 当 shell 开始 运行 的 时 
候 ,环境 中 的 变量 将 被 复制 到 自己 的 变量 列表 里 ,如 图 9.8 所 示 。 一 旦 这 些 值 被 复制 到 变量 
列表 里 ,就 能 用 set 命令 和 赋值 命令 来 查看 和 修改 这 些 变量 了 。 


environ 






VLenviron2table 







TERM=vt 100 





APA ST BIF TT 
到 shell 的 变量 列表 
图 9.8 从 环境 复制 值 到 vartab 
2. 政变 环境 


对 smsh3 的 测试 显示 了 对 TZ 的 改动 并 没有 传 给 date, 现 在 知道 如 何 修改 环境 变量 了 。 
修改 环境 最 简单 的 方法 是 构建 一 个 全 新 的 列表 ,这 个 列表 包含 了 shell 中 的 所 有 变量 。 然 后 
将 全 局 指针 environ 指向 这 个 列表 ,如 图 9.9 所 示 。 调 用 exec, 内 核 将 这 些 设置 复制 到 新 的 
程序 中 。 注 意 , 现 在 没有 被 引用 的 环境 列表 中 和 傅 旧 存 储 着 原来 的 值 ， 

3. 对 smsh &j #4 rk 

在 程序 流程 中 添加 两 步 ,如 图 9.10 所 示 。 这 两 步 通 过 添加 两 行 代 码 来 实现 。 
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environ 








TERM-vtI OUO 
TZ-ESTSEDI] 
PATI /bim /usr /bin 





9.9 将 值 从 vartab 复制 到 新 的 环境 


(1) smsh4. c PH) setup 


void setup) 

ix f 
* purpose; initialize shell 
x returns: nothing. calls fatal() if trouble 
x/ 

i 


extern char ** environ; 


VLenviron2table(environ); 
signal(SIGINT, SIG IGN); 
signal(SIGQUIT, SIG IGN); 


(2) execute2, c 中 的 execute: 


if ( (pid = fork()) == -1) 

perror(í"fork'); 
else if ( pid == 0 }4 

environ = VLtable2environ();/« new line «/ 
signal(SIGINT, SIG DFL); 
signal(SiGQUIT, SIG DFL); 
execvp(argv| 0], argv); 
perrorí( "cannot execute command"): 


exit(l); 







TERN=xterm 
TZ2-PST8PDT 
PATH= / bin: / sbin 





VLtahle2environ 


将 标记 为 辖 出 的 
she11 变 量 复 制 
到 新 建 的 字符 种 
数组 中 


，289 。 
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smish4 
igmore signals 
envzZtab 
[^ ^7 — get command — + exit 
| split line 
y | 

中 -一 — control command? 
| Pn 

| l = 
| m built-in? — — 
| do built-in [— fork —— 
i -一 wait tab2env 

| enable signals 

| execvp 


| | | 
| | | 
| 


exit 





图 9.10 在 smsh 中 增加 环境 处 理 


4. 测试 政 动 后 的 程序 


S$ make snshd 


ce — o smshd smsh4.c splitline.c execute2.c process2.c \ 


controlflow.c builtin.c varlib.c 


S ./smshd 
7 date 


Tue Jul 31 09:51:03 EDT 2001 


— TZ = PSTB8PDT 
> export TZ 


“> date 


Tue Jul 31 06:51:30 PDT 2061 


= 


用 户 可 以 修改 和 增加 环境 变量 ,而 且 shell 也 会 把 这 些 新 的 值 传 给 它 运 
9.6.4 varlib.c 的 代码 


/* varlib.c 


¥ 


+ a simple storage system to store name = value pairs 


* with facility to mark items as part of the environment 


x 


* interface: 


* 


VLstore( name, value ) returns 1 for Ok, 0 for no 


VLlookup( name ) returns string or NULL if not there 


prints out current tabie 


行 的 任何 程序 了 ， 


一 CC OO， 
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* environment — related functions 


* VLexport( name ) adds name to list of env vars 
* VLtabie2environ() copy from table to environ 

x VLenviron2table() copy from environ to table 

* 

x details: 


x the table is stored as an array of structs that 
* contain a flag for global and a single string of 


the form name = value. This allows EZ addition to the 


* 


x environment. It makes searching pretty easy, as 


* 


long as you search for "name = ™ 
* 


x/ 


H include  «stdio.hl» 
i include  «stdlib.h— 
# include — "varlib. h" 


H include + string. i> 
H define MAXYARS 200 /* a linked list would be nicer x/ 


struct var | 


char * Str: /* name = val strings/ 
int global; /* a booleans/ 
Iz 
static struct var tab| MAXVARS |; /* the tablex/ 


static char * new strinq( char x , char * );/« private methods / 


static struct var + find item(char * , int); 


F 


int VLstore( char + name, char * val } 
fx 
* traverse list, if found, replace it, else add at end 
x since there is no delete, a blank one is a free one 
* return 1 if trouble, 0 if ok (like a command} 
x / 
i 
struct var * itemp; 
char 2a. 


int rv = 1; 


/* find spot to put it and make new string #/ 
if (Citemp- find itemí(name,1))! = NULL && 


(s= new_string(name,val))! = NULL) 


if ( itemp— >str ) /* has a val? «/ 


agl 
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free(itemp- —str); /* y; remove it «/ 
itemp --— str = s; 


Fr 


rv = O: /* okl «/ 


char * new string( char * name, char * val } 

i* 
* returns new string of form name = value or NULL on error 
* f 

| 


char * retval; 


retval = malloc( strlen(name) + strlen(val) + 2); 
if ( retval += NULL } 
sprintf(retval, "% s= &s", name, val }; 


return retval; 


char * Vilookup( char * name ) 

ix 
* returns value of var or empty string if not there 
x / 

| 


struct var * itemp; 


if ( Citemp = find item(name,0)) ! - NULL) 
return itemp—- —str + 1 + strlen(name); 


return "". 


int VLexport( char * name ) 
/人 
* marks a var for export, adds it if not there 


* returns 1 for no, 0 for ok 
y / 


struct var * itemp; 


int rv = 1: 


? 


if ( (itemp = find item(name,0)) |= NULL ){ 
itemp- --global = 1; 
ivy = 0: 


1 
i 


else if ( Vistore(name, "") == 1) 
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rv = VLexport(name); 


return rv; 


static struct var x find item( char x name , int first blank } 


F 


Hi * 


* Searches table for an item 

+ returns ptr to struct or NULL if not found 

* OR if (first blank) then ptr to first blank one 
xf 


int i; 
int len = strlen(name)- 


char # ge 


r 


for( i = 0 ; isc MAXVARS && tab| i].str ! » NULL; i++ ) 
4 


s = tabli]. str; 
if ( strnemp(s,name,len) == 0 &&s[len] == +=" }; 
return &tabl i |; 


| 

if { i x MAXVARS && first blank ) 
return &tab|i ; 

return NULL, 


—— 


void VLlistí) 
f» 


* performs the shells set command 
* Lists the contents of the variable table, marking each 
* exported variable wilh the symbol '* ' 


* ij 


int i; 
for(i = 0 ; i-MAXVARS $& tab[i].str {= NULL ; i++ } 


l 
I 


if ( tab[i].global ) 


printf(" + $ s\n", tab[ i]. str); 


r 


else 


printf(" % s\n", tab[i]. str); 


int VLenviron2table(char x env| ]) 


ix 


+ 
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x jnitialize the variable table by loading array of strings 
x return ] for ok, 0 for not ok 
kJ 
: 

int i; 


char x newstring; 


for(i = 0 ; em[i] != NULL ，1== ) 
i 
if ( 1 == MAXVARS ) 
return 0; 
newstring = mailac(1+ strlen(env[i])); 
. if ( newstring == NULL ) 
return Q; 
strepy(newstring, env ij); 
tabl i]. str = newstring; 
tabi]. global = 1; 
} 


while( 1 < MAXVARS }1 /* I know we dont need this */ 
tab[il.str = NULL ; /* static globals are nulled  x/ 
tab[i-- .global = 0; /x by default 只 了 

return 1; 


char *x VLtable2environ() 
/* 
4 build an array of pointers suitable for making a new environment 


* note, you need to free() this when done to avoid memory leaks 


*/ 
{ 
int — i, /* index E 
1, /* another index a / 
n= g; /* counter +/ 
char * * envtab- /* array of pointers +f 
j 


* first, count the number of global variables 
x / 


for( i = 0 + i«-MAXVARS && tab| i]. str |= NULL; i++ ) 
if ( tab[ i].global == 1) 
ntt. 


F 


/* then, allocate space for that many variables  «/ 


envtab = (char ** ) malloc( (n*1) * sizeof(char *} ); 
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if ( envtab == NULL ) 
return NULL; 


/* then, load the array with pointers x*/ 
for(i = 0, j = 0 ; i<{MAXVARS && tab| i].str != NULL :I++ ) 
if ( tab[i]. global == 1) 
envtab| i++ | = tabli,.str; 
envtab[ji] = NULL; 


return envtab; 


9.7 已 实现 的 shell 的 功能 
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在 本 章 中 ,学 习 了 Unix shell 的 可 编程 特征 ,还 在 实现 的 shell 中 增加 了 3 个 重要 的 功 
能 :命令 行 解析 ,if. . then 语句 和 变量 ,使 这 个 小 小 的 shell 成 长 迅速 。 下 面 是 shell 目前 的 特 


征 列表 : 
特征 是 否 支 持 有 待 改 进 
0 8G BERT 
变量 = ,set read, Svar 替换 
if if, . then else 
environ 全 部 
exit exil 
cd cd 
vera 不 支持 全 部 
(OD EFH 
增 册 变量 替换 还 需 进一步 研究 在 流程 中 的 哪 一 步 将 $ X PRA XH? 注意 下 面 的 
例子 
5 read x 
who am i 
$ $x 
nori.xyz.com! nobody ttyl Dec 31 13:56 


$ grep $x /etc/passwd 


grep: am: No such file or directory 


grep: i; No such file or directory 


5 


能 够 从 这 些 输出 中 得 出 哪些 关于 shell 的 分 析 阶 段 和 变量 替换 阶段 之 间 关 系 的 信息 ? 这 
样 的 设计 有 什么 好 处 吗 ? 能 在 这 里 的 程序 中 添加 这 一 特性 吗 ? 
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(2) fé A/S HH E E Ind 
shell 允许 用 户 将 进程 的 输 人 和 输出 重 定向 到 文件 或 者 其 他 进程 .。 ix EA ng ACRI B EY 
能 够 在 这 里 的 shell 中 增加 这 一 特征 吗 ? 将 在 下 一 章 中 学 习 输 和 人 /输出 豆 定 向 。 


* 


d. 


小 8 


. 主要 内 容 


Unix shell 运行 一 种 称 为 脚本 的 程序 。 一 个 shell 脚本 可 以 运行 程序 ,接受 用 户 输 人、 
使 用 变量 各 使 用 复杂 有 的 控制 逻辑 ， 

if.. then iE 4K Hi P XR AL PI: Unix 程序 返回 0 以 表示 成 功 。shell 使 用 wait 来 得 到 
程序 的 退出 状态 ， 

shell 编程 语言 包括 变量 。 这 些 变 量 存 储 字 符 串 ,它们 可 以 在 任何 命令 中 使 用 。shelil 
变量 是 脚本 的 局 部 变量 。 

每 个 程序 都 从 调用 它 的 进程 中 继承 一 个 字符 串 列 表 , 这 个 列表 被 称 为 环境 。 环 境 用 
来 保存 会 话 (session) 的 全 局 设置 和 某 个 程序 的 参数 设置 ,shell 允许 用 户 查 看 和 修改 
环境 ， 

下 一 步 做 什么 


将 学 习 输 入 /输出 的 重 定 癌 。 


3. 


习题 


9.1 编写 名 为 set 的 一 个 上 程序 或 脚本 ISAC ASH shell 来 运行 它们 ， 会 有 什 


AWB? 写 一 个 名 为 no 一 dice 的 上 程序 或 者 脚本 然后 试 着 执行 它 , 又 会 如 条 ?7 用 
同样 的 方法 试 试 名 为 test 的 程序 。 有 没有 办 法 运行 这 些 程序 呢 ? 


9.2 能 修改 process. c 和 controlflow. c BJ i ir Riz. x REEX E RS Bas? 这 就 是 说 ， 


E BE ah BR PE XII Sic ALI 7 
if cmdl 
then 
if cmd2 
then 
cmd 
else 
cmd4 
fi 
else 
cmds 
fi 
馆 套 层次 可 以 是 任意 深度 ,而 不 是 像 这 里 所 显示 的 1 层 。 需 要 更 多 的 状态 变量 取 ? 
锚 要 一 个 栈 来 保存 这 些 状 态 变 量 吗 ? 如 果 构 造 一 个 栈 , 用 递归 的 方法 来 解决 是 不 
是 合理 ? 


9. 3 


Eog 可 编程 的 shell shell 变量 和 环境 :编写 月 已 的 shell € 9]. 


varlib. c FP Ej eg OB st 9) g — TRAE. AAAS realloc 来 
PEL BS Im E YI BS BS CAL NR? 


4, Se FE HJ 


9.4 


修改 smshl.c 使 之 能 够 在 一 行 中 接受 多 个 命令 。 要 做 到 这 一 点 最 简单 的 方法 是 
修改 next cmd 明 数 ,注意 不 要 打印 和 多余 的 提示 符 。 


修改 smshl.e 使 之 能 够 接受 带 可 选 参 数 的 exit HS. 保证 你 的 程序 拒绝 非 整 数 
的 参数 (比如 :exit left)。 原 来 的 流程 中 在 哪 里 处 理 这 个 命令 ?需要 增加 新 的 节 厂 
到 有 原来 的 流程 中 去 吗 ? 


修改 process. c 使 之 能 支持 {控制 语句 中 的 else 部 分 。 


ok to execute 隔 数 使 用 两 个 变量 米 记 录 当 前 的 区 域 和 状态 。 可 以 用 一 个 有 多 个 
值 的 变量 来 替代 原来 的 两 个 变 景 。 涛 卡 下 面 一 组 状态 ; 
NEUTRAL, IF SUCCEEDED, IF FAILED, SKIPPING THEN, DOING THEN, SKIPPING ELSE, DOING 
_ELSE 


修改 controlflow. e 以 使 用 这 个 单 变 量 的 系统 。 


修改 smshl.c 使 之 能 接受 & 命令 结束 符 。 以 这 个 符 导 结束 的 命令 将 在 后 台 运 行 。 
需要 对 next_cmd 做 一 些 修改 。 


常规 的 shell 直到 读 到 最 后 Fi CHEER AE final 的 缩写 , 俐 是 反 过 来 的 f) 才 执行 整 
个 语句 块 。 另 一 个 完全 不 同 的 做 法 是 将 i 结构 中 的 所 有 语句 读 入 - -个 有 三 个 部 
分 的 结构 体 中 。 第 一 个 部 分 是 条 件 命令 ,第 二 个 部 分 是 then 区 域 ,最 后 是 else 区 
域 的 命令 。 

将 整个 块 读 入 内 存 后 ,就 能 开始 执行 条 件 命 令 , 基 于 它们 的 结果 ,执行 then 区 域 或 者 
else 区域 。 写 一 个 采用 这 个 方案 的 smsh。 你 的 解 应 该 能 接受 嵌 僚 的 并 请 名 


在 你 的 shell 中 添加 while 循 坏 ，。 为 了 增 如 这 个 功能 ,需要 把 循环 体 读 和 人 内存 ,小 
[^ US TE HE (memory leak), 


一 个 进程 有 很 多 属性 ,其 中 之 一 是 这 个 进程 的 当前 日 录 。Unix 的 发 明 者 号 了 个 
程序 chdir, X£: FL fb — Ye ps HE BY H € EF i pwd. lsem 等 。 RHR OAR 
A. E$TAS T RE ELTE HI shell RSM. chdir WARP ATA BS? 在 你 的 
shell 中 添加 ed fir. 


shell 支持 特殊 的 变量 来 表示 系统 设置 。 比 如 ,变量 SS 表示 shell 的 进程 ID m 
s? 表示 最 后 一 条 命令 的 退出 状态 值 。 在 你 的 程序 中 于 加 这 些 变量 。 

在 标准 Unix shell 的 命令 行 中 ,可 以 将 引号 引起 来 的 部 分 作为 一 个 独立 的 参数 ， 
一 个 命令 像 vi "My Book Report" 和 包含 两 个 命令 行 参数 。 使 你 的 shell 接受 引号 。 


9, 


s US S 


14 
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在 shell 的 哪 一 部 分 处 理 引 号 ? 考虑 命令 rm "filel. c;2"。 就 算 你 的 程序 将 分 号 
理解 为 命令 分 隔 符 ,这 个 表达 式 还 是 应 该 被 理解 为 一 条 有 两 个 参数 的 命令 . 


很 多 shell 允许 用 户 通过 对 一 个 特定 的 变量 赋值 来 设置 命令 提示 符 , 在 你 的 shell 
中 增加 这 个 特征 。 在 自己 的 shell 中 定义 一 个 变量 来 表示 提示 符 。sh 和 bash 用 
EE PS1, m csh 家 族 用 变量 prompt, 
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概念 与 技巧 

* YORE: 概念 与 原因 

© 标准 输入 .输出 和 标准 错误 的 定义 
。 重 定向 标准 L/D 到 文件 

© 使 用 fork 来 为 其 他 程序 重 定向 

* iA (Pipe) 

。 创建 管道 后 调用 fork 

相关 的 系统 调用 与 洗 数 

* dup.dup2 

* pipe 


10.1 shell 编程 


下 面 这 组 命令 是 如 何 工作 的 ? 


is — my. files 
who | sort--userlist 


shell 是 如 何 告诉 程序 将 结果 输出 到 文件 而 不 是 屏幕 的 呢 ? shell 又 是 如 何 将 一 个 进程 
的 输出 流连 接 到 另 一 个 进 得 的 输入 流 的 呢 ? 标准 输入 (standard input) 这 个 本 语 是 什么 
意思 ? 

本 章 将 关注 进程 间 通 信 的 一 种 特殊 形式 : 输 人 /输出 重 定 向 和 和 管道 (I/O redirection and 
pipes)。 首 先 将 介绍 在 编写 shell 脚本 时 L/O 重 定 向 和 管道 所 起 的 作用 。 然 后 ,本 章 将 介绍 
操作 系统 中 对 L/O 重 定 问 的 支持 。 最 后 , 写 一 个 程序 来 改变 进程 的 输入 各 输出 流 。 
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10.2 一 个 shell 应 用 程序 : Uy at Aa EH 


考虑 一 下 这 个 问题 : 你 的 许多 朋友 和 你 使 用 同一 个 Unix 系统 。 你 希望 编写 一 个 程序 ， 
当 其 他 有 用户 登录 系统 或 注销 时 通知 你 。 这 样 你 就 可 以 了 解 朋友 们 的 活动 。 

可 以 写 一 个 使 用 ump 文件 和 间隔 计数 器 的 C 程序 来 完成 任务 。 程 序 打 开 utmp 文件 ， 
记录 下 用 户 列表 ,休眠 一 段 时 间 后 再 重新 扫描 此 文件 ,并 将 变化 报告 出 来 。 

一 个 更 简单 的 办 法 就 是 写 一 个 shell 脚本 。Unix 中 有 一 个 列 出 当前 用 户 的 命令 : who, 
Unix 中 同样 包含 了 休眠 和 处 理 字 符 串 列表 的 程序 。 下 面 是 一 个 Unix 的 脚本 .用 来 报告 所 有 
的 登录 和 注销 情况 。 


Logic shell code 
get list of users(ca:i it prev) who | sort > prev 
while true while true ; do 
sleep sleep 60 
get list of uzers(caJ: if curr) who | sort 2 curr 
compare lists echo "logged out, " 
in prev, noL in curr -> logovt comm — 23 prev curr 


echo "Jogged in, " 


in curr, not in prev — login comm ~ 13 prev curr 
make prev = curr nv Curr prev 
repeat done 


He AST Unix 系统 所 提供 的 7 个 工具 、 一 个 while 循环 和 L/O 重 定向 ,编写 这 个 程 
序 解决 了 问题 。 仔 细 看 一 下 这 些 程序 的 细节 ,以 及 它们 之 间 的 连接 。 

脚本 中 的 第 一 行 建立 了 一 个 在 此 脚本 运行 时 已 登录 几 户 的 列表 .并 技 用 户 名 进行 排序 。 
who 命令 输出 用 户 列 表 , 而 son 命令 将 列表 作为 输入 读 进 ,然后 输出 一 个 排 好 序 的 列表 ， 

命令 who | sort > prev 告诉 shell 同时 执行 who 和 sort. f£ who 的 输出 直接 送 到 sort 
的 输入 ,如 图 10. 1 所 示 。who 命令 并 不 一 定 要 在 sori 命令 开始 读 取 和 排序 之 前 完成 对 
ump 文件 的 分 析 。 这 两 个 进程 以 很 小 的 时 间 和 间隔 为 单位 夹 汕 度 , 它 们 和 系统 中 的 其 他 进程 
一 起 分 享 CPU Ha, Ra sorn > prev 告诉 shell 将 sort 的 输出 送 至 prev 文件 中 。 若 此 文 
件 不 存在 , 则 创建 此 文件 ; 车 已 经 存在 , 则 替换 其 内 容 。 





图 10. ! 将 who 的 输出 连结 到 sort WA A 
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在 休 有 卢 一 分 钟 之 后 ,脚本 在 文件 corr 中 创建 了 一 个 新 的 用 户 列表 。 如 何 来 比较 两 个 排 
好 序 的 登录 记录 列表 呢 ? 使 用 Unix 的 工具 comm( 如 图 10. 2 所 示 }), 可 以 找 出 两 个 文件 中 共 
有 的 行 。 此 较 两 个 文件 可 以 得 到 三 个 子 集 ; RRA 1 有 的 行 , 仅 文件 2 有 的 行 , 两 者 共有 的 
fi. comm 命令 比较 了 两 个 排 过 序 的 列表 ,并 将 此 三 列 打 印 出 来 ,这 里 的 每 一 列 代表 一 个 子 
集 的 内 容 。 可 以 使 用 命令 行 选项 来 让 结果 只 出 现 其 中 的 任意 一 列 或 两 列 。 比 如 说 ,如 下 两 
个 命令 ; 

comm — 23 prev curr 斗 删 除 第 二 列 和 第 三 列 =* 疏 显示 prer 中 的 内 容 

comm - 13 prev curr 半 删 除 第 一 列 和 第 三 列 =) 仅 显示 curr 中 的 内 容 


生成 所 需要 的 两 个 集合 : 前 一 个 列表 中 有 而 当前 列 宸 中 没有 的 登录 记录 (注销 的 用 户 ), 以 及 
当前 列表 中 有 而 前 一 个 列表 中 没有 的 登录 记录 (新 登录 用 户 )， 


图 10,2? comm 比较 两 个 列表 ,输出 三 个 集合 


Hn. mv curr prev 将 当前 列表 文件 curr 更 名 为 prev* 并 替换 原来 的 prev 文件 。 

watch. sh 丢 本 体现 了 三 个 重要 的 思路 : 

(1) shell 脚本 的 功能 一 一 与 心 相 比 身 单 易 用 ， 

(2) 软件 工具 的 灵活 性 一 一 每 一 个 工具 完成 一 项 特定 的 .通用 的 功能 ; 

(3) L/O 重 定向 和 管道 的 使 用 和 作用 。 

程序 watch. sh 展示 了 如 何 使 用 “ 半 " 操 作答 来 把 文件 着 成 任意 大 小 和 结 椅 的 变量 。 类 似 
于 某 人 用 芯 写 了 如 下 的 调用 ， 


x = func a(func bfy))，  /+ $ fune hb 的 结果 作为 func a 的 输入 #*/ 
用 shell 写 ,就 是 ， : 

prog_b | prog a “> x # 4% prog_b 的 结果 作为 prog_a 的 输入 并 将 最 终结 果 放 人 x 

这 些 程序 如 何 工 作 的 ? shell 在 进程 的 连接 中 起 什么 样 的 作用 呢 ? 内 核 起 什么 作用 ? 单 
个 程序 又 起 什么 作用 ? 


10.3 标准 IO 与 重 定向 的 若干 概念 


所 有 的 Unix VO 重 定 向 部 基于 标准 数据 流 的 原理 。 考 虑 一 下 sort 工具 是 如 何 工作 的 。 
sort 从 一 个 数据 流 中 读 取 字 节 ,再 将 结果 输出 到 另 一 个 流 中 ,同时 车 有 错误 发 生 , 则 将 错误 报 
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告 给 第 三 个 流 。 如 果 忽 略 这 些 标准 流 的 去 向 问题 ,sort 工具 的 基本 原型 就 如 图 10. 3 Pom. 
三 个 数据 流 分 别 如 下 : 

， 标准 输 人 一 一 需要 处 理 的 数据 流 

标准 输出 一 一 结果 数据 流 

。 标准 错误 输出 一 一 错误 消息 尝 





-— FAIA E 


iid RB 
图 10.3 sort CL FORES A BE AEAN wb AUR. FUR UE RI. 


10.3.1. 概念 1: 3 个 标准 文件 描述 符 


所 有 的 Unix 工具 都 使 用 图 10. 3 中 所 示 的 三 种 流 的 模型 。 此 模型 通过 一 个 简单 的 规则 
来 实现 。 这 三 种 流 的 每 一 种 都 是 一 个 特别 的 文件 描述 符 , 其 细节 如 图 10. 4 Bron. 








MEXHIT 
T | "i L Me j T 5 i ES. 0: stdin 
nt P ms UA S HE ]: stdout 
e 1p honte dual 2: stderr 


B J 
| BE 


j = r x 
L 


E 
á à 
jeiki CHEREDSOk— e Runs el 


图 10,4 3 个 特殊 的 文件 的 述 符 


BUE: 所 有 的 Unix 工具 都 使 用 文件 描述 符 0.18 2。 
标准 输 人 文件 的 描述 符 是 0, 标准 输出 的 文件 描述 符 是 1 .而 标准 错误 输出 的 文件 描述 得 
则 是 2。Unix 假设 文件 描述 符 0、1、2 已 经 被 打开 ,可 以 分 别 进行 读 、 写 和 写 的 操作 了 ， 


10.3.2 BRUKER: tty 


通常 通过 shell 命令 行 运 行 Unix 系统 工具 时 ,stdin stdout 和 stderr 连接 在 终端 上 。 因 
此 ,工具 从 键盘 读 取 数据 并 且 把 输出 和 错误 消息 与 到 屏幕 .举例 来 说 ,如 果 输 人 sort 并 按 下 
回 车 键 ,终端 将 会 被 连接 到 sort 工具 上 。 随 便 输 入 几 行 文字 , 当 按 Ctrl-D 键 来 结束 文字 答 
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人 的 时 候 ,sort FEJT XT 88 A ETT HE Pr FE A) stdout, 
大 部 分 的 Unix 工具 处 理 从 文件 或 标准 输入 读 人 的 数据 。 如 果 在 命令 行 上 给 出 了 文件 


名 ,工具 将 从 文件 读 取 数据 。 若 无 文件 名 ,程序 则 从 标准 输入 该 取 数 据 ， 


10.3.3 程序 都 输出 到 stdout 


从 男 一 方面 说 ,大 多 数 程 序 并 不 接收 输出 义 件 和 名; 它们 总 是 将 结果 写 到 文件 描述 得 1, 并 
将 错误 消息 写 到 文件 描述 符 28。 如 果 和 希望 将 进程 的 输出 写 到 文件 或 另 一 个 进程 的 输入 去 ， 
就 必须 重 定向 相应 的 文件 措 述 符 。 


10.3.4 EALO 的 是 shel 而 不 是 程序 


通过 使 用 输出 重 定 向 标志 ,命令 cmd filename 告诉 shell 将 文件 描述 符 1 定位 到 文件 ， 


于 是 shell 就 将 文件 摘 述 符 与 指定 的 文件 连接 起 来 。 
程序 则 持续 不 断 地 将 数据 写 到 文件 描述 符 1 中 ,根本 没有 意识 到 数据 的 目的 地 已 经 政变 
了 。 下 面 的 程序 hstargs.c 展示 了 程序 甚至 没有 看 到 命令 行 中 的 重 定 向 符号 : 


/* listargs.c 


x* print the number of command line args, list the args, 
+ then print a message to stderr 
x 


# include < stdio. h> 
main( int ac, char * av| |) 


i 


int i; 


printf("Number of args: $d, Args are. An", ac); 
for(i- 0: i< ac: EPEE) 


printf("args[ $d; %s\n", i, av[i]; 


fprintf(stderr, "This message is sent to stderr. Xn"); 


} 
程序 listargs 将 命令 行 参数 打印 到 标准 输出 。 注意 listargs 并 没有 打印 出 重 定向 符号 和 
文件 名 。 


5 cc listargs.c 一 o listargs 
5 ./listargs testing one two 
args[0] ./listargs 

args|1] testing 

args| 2] one 

argsi 3| two 


This message is sent to stderr. 


(D sort 和 dd wS ftiT HR stdout ,但 这 是 由 于 其 他 的 原因 . 
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S ./listargs testing one two > xyz 
This message is sent to stder. 
$ cat xyz 
args[01. /listargs 
args| 1] testing 
args[ 2] one 
args] 3] two 
s ./listargs testing “xyz one two 2 —— oops 
5 cot xyz 
args[0' . /listargs 
args[ 11 testing 
args! 2] one 
args[ 3] two 
S cat cops 


This message is sent to stderr. 


这 些 例子 验证 了 关于 shell 输出 重 定 向 的 一 些 重 要 和 概念。 最 重要 的 一 点 是 shell 并 不 将 
重 定向 标记 和 和 尺 件 名 传递 给 程序 。 

第 二 个 概念 是 重 定 回 可 以 出 现在 命令 行 中 的 任何 地 方 , 并 且 在 重 定 向 标识 符 周 围 并 不 
需要 空格 来 区 分 。 基 至 一 个 像 listing ls 这 样 的 命令 也 是 可 以 接受 的 。 这 梓 ,“ 半 "符号 并 
不 能 终止 命令 和 参数 , 它 只 不 过 是 一 个 附加 的 请 求 而 已 ， 

最 后 一 个 概念 是 许多 版 本 的 shell 都 提供 对 重 定 回 其 他 文件 描述 符 的 支持 ，。 例 如 ， 
2>> filename 即 重 定向 文件 描述 符 2, 也 就 是 将 标准 铺 误 输出 到 给 定 的 文件 中 。 


10.3.5 理解 LI7GO SEI 


在 watch. sh 中 可 以 看 到 , I/O Biz Unix 程序 设计 中 一 个 重要 部 分 。 同 样 在 
listargs. c 中 看 到 ,是 shell, 而 非 程序 将 输入 利 输出 重 定向 的 。 

但 shell 是 如 何 重 定向 1/O 的 呢 ? ERG RE L/O B) BYR? 本 章 的 工作 就 是 编写 
可 以 完成 三 个 基本 的 重 定 问 操作 的 程序 ， 


» who userlist 将 stdout 连接 到 一 个 文件 
* sort< data 将 stdin 连接 到 一 个 文 性 
a whol sort 将 stdout 连接 到 stdin 


10.3.6 概念 2: “RK RI A tE FF ( Lowest - Available- fd) " Ez m 


MATAELE? 文件 描述 符 的 概念 非常 简单 : 它 是 一 个 数组 的 索引 号 。 每 
信 进 程 都 有 其 打开 的 一 组 文人 性。 这 些 打开 的 文件 被 保 特 在 一 个 数组 中 。 文 件 措 述 符 即 为 某 
文件 在 此 数组 中 的 索引 。 图 10.5 fos T "Ee fi a] FH xf dE XS TI Lowest 7 Available- fd)" 
原则 。 
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图 10.5 最 低 可 用 文件 描述 符 原 则 


BUE. 当 打 开 文 件 时 ,为 此 文件 安排 的 擂 述 符 总 是 此 数组 中 最 低 可 用 位 置 的 索引 。 

通过 文件 描述 符 建立 一 个 新 的 连接 就 像 在 一 条 多 路 电话 上 接收 一 个 连接 一 样 。 每 当 有 
用 户 挨 一 个 电话 号 码 , 内 部 电话 系统 为 这 个 拨号 请 求 分 配 一 条 内 部 的 线路 号 。 在 许多 这 样 
的 系统 上 ,下 一 个 打 进 来 的 电 庄 就 被 分 配给 最 小 可 用 的 线路 号 ， 


10.3.7 两 个 概念 的 结合 


| 已 经 介绍 了 两 个 基本 的 概念 。 首 先 ,Unix ARERR 0.1.2 作为 标准 输入 .和 输 

出 和 错误 的 通道 。 其 次 , 当 进 程 请 求 一 个 新 的 文件 描述 符 的 时 钞 , 系 统 内 核 将 最 低 可 用 的 文 
件 描 述 符 几 给 它 。 将 这 两 个 概念 结合 在 一 起 :大 家 就 可 以 理解 JMO 重 定 向 是 如 何 工 作 的 了 ， 
也 就 可 以 自己 写 出 程序 来 完成 UO 的 重 定 问 。 


10.4 如 何 将 stdin Œ BiN PF 


下 面 将 详细 地 考察 ,程序 如 何 将 标准 输 人 重 定 向 以 至 可 以 从 文件 中 读 取 数据 。 更 加 精 
确 一 点 说 ,进程 并 不 是 从 文件 读数 据 , 而 是 从 文件 描述 符 读数 据 。 如 果 将 文件 描述 符 0 定位 
到 一 个 文件 ,那么 此 文件 就 成 为 标准 和 输入 的 源 。 

下 面 将 考察 三 种 将 标准 输入 定位 到 文件 的 方法 。 其 中 有 些 方法 并 不 适 台 于 文件 ,但 使 
用 管道 的 时 候 ,这 些 方 法 都 是 必要 的 。 


10.4.1 方法 1: close then open 


第 一 种 方法 是 close- then - open 策略 。 这 种 技术 类 似 于 挂 断 电话 释放 一 条 线路 ,然后 
再 将 电话 擒 起 从 而 得 到 另 一 条 线路 。 具 体 步 邓 如 下 。 

开始 的 时 候 . 系 统 中 采用 的 是 典型 的 设置 。 即 三 种 标准 流 是 被 连接 到 终端 设备 上 的 。 
输入 的 数据 流 经 过 文件 描述 符 0 而 输出 的 流 经 过 文件 描述 符 1 和 和 2, 如 见 图 10. 6 所 示 ， 

接 下 来 .第 一 步 是 close(0)，; 即 将 标准 输入 的 连接 挂 断 。 这 里 调用 close(0) 将 标准 输入 
与 终 峭 疫 备 的 连接 切断 。 图 10. 7 中 显示 了 当前 文件 描述 符 数组 中 的 第 一 个 元 素 现在 处 在 空 
用 状态 。 
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图 10.6 上 典型 的 初始 化 配置 


Ud Ad close (0) 之 后 


i 
r | 
à 





10.7 stdin EE XH] 


最 后 ,使 用 open(filename,O_RDONLY) H A — 4-8 XE HE 8] stdin 上 的 文件 。 当 前 的 最 
低 可 用 文件 描述 符 是 0, 因 此 所 打开 的 文件 将 被 连接 到 标准 输入 上 去 。 如 图 10. 8 所 示 ,任何 
从 标准 输入 读 取 数据 的 孙 数 都 将 从 此 文件 中 读 和 信人， 


i ^| WH open ( ) 之 后 






| | Ane! | open 调用 创建 了 一 个 到 
| | 文件 的 连接 ， 并 建立 指向 
t 最低 可 能 表 项 的 指针 ， 


图 10.8 stdin 现在 已 经 连接 到 文件 上 了 
下 面 的 程序 即使 用 close- then - open 方法 ， 


*/ stdinredirl.c 

* purpose; show how to redirect standard input by replacing File 
x descriptor 0 with a connection toa file. 

* action; reads three lines From standard input, then 


* closes fd 0, opens a disk file, then reads in 
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x three more lines fron standard input 
x/ 
i include — «— stdio.h-— 


# include «= fentl. h> 


maint ) 
i 
int fd ; 
char linef100]; 


/* read and print three lines «/ 


fgets( line, 100, stdin ); printf(" €& s", line); 
fgets( line, 100, stdin ); printf(" € 5", line}; 
fgets( line, 100, stdin); printf(" 5s", line}; 


/x redirect input x»/ 


close(0); 

fd = opent"/etc/passwd", O RDONLY): 

if (fd l= 0 }{ 
fprintf(stderr, "Could not open data as fd 0\n"); 
exit(1); 

} 


/* read and print three lines «/ 


fgets( line, 100, stdin ); printf(" €$ s", line); 
fgets( line, 100, stdin }; printf("%s", line ); 
fgets( line, 100, stdin ); printf("* s", line); 


程序 stdinreaderl 从 标准 输入 读 取 并 人 打印 了 三 行 字符 串 ,然后 重 定向 标准 输入, 之 后 又 
从 标准 输 大 中 读 取 并 打印 了 三 行 字 符 串 。stdinreaderl 从 键盘 读 了 到 了 前 三 行 字 符 串 ,而 后 三 
t1 E T BEM passwd 文件 中 读 出 的 : 


s ./stdinredirl 

linel 

linel 

testing line2 

testing line2 

line 3 here 

line 3 here 

root, x; Ü; 0. root, /root, /bin/bash 
bin; x. 1; 1, bin, /bin, 

daemon. x. 2: 2; daemon. /sbin; 


3 
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立 起 来 后 .就 可 以 从 标准 输入 的 一 个 新 的 源 接收 数据 了 。 


10.4.2 方法 2: open. .close.. dup. . close 


Hj PRP: 电话 响 了 ,你 拿 起 了 楼 上 的 分 机 ,但 你 意识 到 自己 应 该 下 楼 去 接 电 
话 。 于 是 你 让 楼 下 的 人 把 电话 扒 起 ,这 样 就 有 两 个 连接 ,然后 把 楼 上 的 分 机 挂 断 .此 叶 税 下 
的 电话 是 惟一 的 连接 了 。 这 种 情况 大 家 是 不 是 很 熟悉 ? 其 实 这 种 方法 的 思路 就 是 从 楼 上 的 
电话 复制 一 个 连接 到 楼 下 ,然后 就 可 以 在 不 断 线 的 情况 下 将 槛 上 的 连接 切断 。 
ui 10.9 Brz& .Unix 系统 调用 dup 建立 指向 已 经 存在 的 文件 描述 符 的 第 二 个 连接 。 这 
种 方法 需要 ASR. 
(1) apen( hile) 
第 一 步 是 打开 stdin 将 要 重 定向 的 文件 。 这 个 调用 返回 一 个 文件 狂 述 符 , 这 个 描述 符 并 
不 是 0, 因 为 0 在 当前 已 经 被 打开 了 。 
(2) close(CO) 
下 一 步 是 将 文件 描述 符 0 关闭 。 文件 描述 符 OMEEASAT. 
(3) dup(fd) 
系统 调用 dup({d) 将 文件 描述 符 fd 做 了 一 个 复制 。 此 次 复制 使 用 最 低 可 用 文件 描述 符 
。 因 此 ,获得 的 文件 描述 符 是 0。 这 样 ,就 将 磁盘 文件 与 文件 描述 符 0 连接 在 一 起 了 。 
(4) close({d) 
最 后 ,使 用 cjose(fd) 来 关 团 文件 的 原始 连接 ,只 留 下 文件 描述 符 0 的 连接 。 将 这 种 方法 
与 把 电 抽 从 一 个 分 机 转移 到 另 一 个 分 届 的 技术 做 一 个 比较 。 


< 


fd = open("f£", O RDONLY); closet); 


tur i 
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图 10.9 使 用 dup 重 定向 
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下 面 的 程序 stdinredir2. c 使用 了 第 二 种 方法 : 


/* stdinredir2.c 
* shows two more methods for redirecting standard input 
x use # define to sek one or the other 
x 

tt# include «Z stdio. h> 


H include <_fentl.h= 


/* x define CLOSE DUP /* open, close, dup, close */ 


/* d define USE DUP2 /* open, dup2, close x/ 
maint } 
f 

int fd ; 

int newfd; 


char . line 100]; 
/* read and print three lines */ 


fgets( line, 100, stdin >; printf(" *& s", line); 
fgets( line, 100, stdin); printf(" $ s", line }; 
fgets( line, 100, stdin ); printf(" * s", line 5; 


/* redirect input */ 


fd = open("data", O RDONLY); /* open the disk file «/ 
# ifdef CLOSE DUP 
close(05; 


newfd = cupt({d); /* copy open fd to 0 x/ 
Helse 

newfd = dup2(fd,0)0; /* close 0, dup fd to 0 «/ 
p endif 


if ( newfd !- 6 M 
fprintf(stderr, "Could not duplicate fd to 0\n"); 
exib(1); | 

i 

closel fd) > /* close original fd x/ 


/* read and print three lines «/ 


fgets( line, 100, stdin); printf(" & s", line); 

fgets( line, 100, stdin >; printf("* s", line); 

fgets( line, 100, stdin ); printf(" & s", line 5; 
' 


介绍 上 面 提 到 的 这 个 包 依 有 4 个 步骤 的 方法 的 主要 目的 是 为 了 让 大 家 了 解 dup 系统 调 
用 ,这 个 调用 在 后 面 学 习 管 道 的 时 候 是 非常 重要 的 。 一 个 简单 一 点 的 方案 是 将 closet0) 和 
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dup(fd) 结 合 在 一 起 作为 一 个 单独 的 系统 调用 dup2。 


10.4.3 系统 调用 dup 小 结 


dup. dup2 
目标 复制 … 个 文件 描述 符 

3L ox ft # include < unistd, ho 
eR X S SI newfd = dupColdfd? ; 

newfd = dup2(old[d,newld); 
参数 oldid 需要 复制 的 文件 抄 述 符 

BE 7 newfd 复制 oldfd 后 得 到 的 文件 描述 符 

返回 值 = 发 生 和 错误 

newld 新 的 文件 描述 符 


系统 调用 dup 复制 了 文件 描述 符 oldfd。 而 dup2 将 oldid 文件 描述 符 复 制 给 newid. W 
个 文件 描述 符 都 指向 同一 个 打开 的 文件 。 这 两 个 调用 都 返回 新 的 文件 措 述 符 , 若 发 生 错 诉 ， 
则 返回 一 1。 


10.4.4 方法 3; open. . dup2. . close 


程序 stdinredir2. c £133 f. & (er Aa E (XB H ifdef, FH SEIS dup2 (fd,0) 来 替换 close(0) 
和 dup(fd)。dup2(Corig,new) 将 文件 描述 符 old 复制 到 文件 描述 符 new ,在 此 之 前 它 先 将 文 
件 描述 符 new 上 已 经 存在 的 连接 关闭 。 


10.4.5 shell 为 其 他 程序 重 定向 stdin 


这 些 例子 显示 了 程序 如 何 将 标准 输入 重 定向 到 文件 。 实 际 上 ,如 果 程 序 着 望 读 取 文件 ， 
它 直接 打开 文件 就 可 以 了 ,根本 不 需要 将 标准 输 人 重 定向 到 文件 。 这 些 例 子 的 真正 意义 在 
于 说 明 一 个 程序 如 何 将 标准 输 人 重 定向 到 别 的 程序 。 


10.5 “为 其 他 程序 重 定向 I/O: who > userlist 


HERPA who>>userlist.shell 运行 who 程序 ,并 将 who 的 标准 输出 重 定 向 到 名 为 
userlist 的 文件 上 。 这 是 如 何 完成 的 呢 ? 

关键 之 处 就 在 于 fork 和 exec 之 闻 的 时 间 间 隙 。 在 fork 执行 之 后 , 子 进程 仍然 在 运行 
shell 程序 ,并 准备 执行 exec。exec 将 蔡 换 进程 中 运行 的 程序 ,但 它 不 会 改变 进程 的 属性 和 进 
程 中 所 有 的 连接 。 也 就 是 说 ,在 运行 过 exec 之 后 ,进程 的 用 户 ID 不 会 改变 ,其 优先 级 不 会 改 
变 , 并 且 其 文件 描述 符 也 和 和 运行 exec 之 前 一 样 。 注意 ,程序 得 到 的 是 载 入 它 的 进程 所 打开 的 
文件 。 图 10.10 展示 了 子 进程 的 输出 重 定向 。 
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T ot ck T AX UERU DIL TT 
文件 的 指针 , 子 进 程 乔 定向 标 
准 输出 ， 

close(131 

ereate( "[") 





exect) 1 
\ 打 开 被 子 进程 继 承 的 文件 
被 子 进 程 打 开 文 件 





图 10. 10 shell 为 子 进程 重 定向 其 输出 


掉 一 下 和 如何 使 用 这 个 原则 来 重 定向 标准 栓 出 。 

1、 和 初始 情况 

如 图 10.11 fk ,进程 运行 在 用 户 空间 中 。 文 件 描述 符 1 连接 在 打开 的 文件 {上 。 为 了 
使 这 幅 图 清楚 易 理 解 ,其 他 打开 的 文件 并 未 画 出 来 ， 





图 10. 11 在 调用 fork 之 间 的 进程 以 及 它 的 标准 输出 


2. 父 进 程 调用 fork 之 后 

如 图 10. 12 Bron ,新 的 进程 出 现 了 。 此 进程 与 原始 进程 运行 相同 的 代码 ,但 它 知道 自己 
是 子 进 程 。 此 进程 包含 了 与 父 进 程 相同 的 代码 :数据 和 打开 文件 的 文件 摘 述 符 。 因 此 文件 
描述 符 1 依然 带 向 的 是 文件 1f。 然 后 子 进程 调用 了 close(1)， 





图 10.12 子 进 程 的 标准 答 出 从 分 进程 那儿 继承 而 得 


3， 在 子 进 程 调 用 close(1) 之 后 
如 图 10. 13 所 示 ，, 父 进程 并 没有 调用 close(1), 因 此 父 进 程 中 的 文件 描述 符 1 仍然 指向 
f。 子 进程 凋 用 close(1) 之 后 .文件 描述 符 1 变 成 了 最 低 未 用 文件 描述 符 。 子 进程 现在 试 着 
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4. 在 子 进 程 调用 creat("g",m) 之 后 
如 图 10. 14 所 示 ,文件 描述 符 1 被 连接 到 文件 g。 子 进程 的 标准 输出 被 重 定 癌 到 g。 子 
进程 然后 调用 exec 来 运行 who, 





810.14. 子 进程 打开 一 个 新 的 文件 得 到 fd= 


5， 在 子 进程 使 用 exec 执行 新 程序 之 后 

如 图 10. 15 所 示 , 子 进程 执行 了 who 程序 。 于 是 子 进 程 中 的 代码 和 数据 都 被 who 程序 
的 代码 和 数据 所 替代 了 , 然而 文件 描述 符 被 保留 下 来 。 打 开 的 文件 并 非 是 程序 的 代码 也 不 
是 数据 ,它们 属于 进程 的 属性 ,因此 exec 调用 并 不 改变 它们 。 
子 进程 
条 的 程序 


指向 打开 文件 的 指 

针 是 进程 的 一 部 分 : 
| 但 此 数组 并 不 是 程 
序 中 的 数据 ， 


MU 






PG. 15 子 进 得 送 行程 序 并 将 标准 输出 重 定向 


who 命令 将 当前 用 户 列 表 送 至 文件 描述 符 和。 其 实 这 组 字 节 已 经 被 写 到 文件 g 中 去 了 ， 
而 who 命令 却 训 不 知晓 。 
下 面 的 程序 whotofije. c 展示 了 上 面 所 说 的 这 种 方法 ; 


BHE VO see AA * i4 Me 





fw whotofile.c 
* purpose: show how to redirect output for another program 


* idea: fork, then in the child, redirect output, then exec 
af 


H include  sstdio.hl- 


main) 

| 
int pid; 
int fd: 


printf("About to run who into a File\n"); 


/* create a new process or quit x*/ 

if( (pid = fork() ) == ~1) 
pexrror("fork"); exit(1); 

i 

/* child does the work */ 

if ( pid == 0){ 


close(1); /* close, */ 
fd = creat( "userlist", 0644 }; /* then open «/ 
execlpt "who", "who", NULL }; /* and run «/ 


perror("execlp"); 

exit(1); 
| 
/* parent waits then reports x/ 
if ( pid |= 021 

WAlt( NULL) ; 


printf("Done running who. results in userlist\n")> 


重 定 向 到 文件 的 小 结 

共有 三 个 基本 的 概念 ,利用 它们 使 得 Unix 下 的 程序 可 以 轻易 地 将 标准 输 人 、 输 出 和 错 
误 信 息 输 出 连接 到 文件 : 

CO 标准 输入 .输出 以 及 错误 输出 分 别 对 应 于 文件 描述 符 0.1.、2; 

C2) 内核 上 总 是 使 用 最 低 可 用 文件 描述 符 ; 

(3) 文件 描述 符 集 合 通 过 exec 调用 传递 , 旦 不 会 被 改变 。 

shell 使 用 进 程 通过 fork 产生 子 进 程 与 子 进程 调用 exec 之 何 的 时 间 癌 隔 米 重 定向 标准 
输入 .输出 到 文件 。 

shell 同样 支持 下 面 忆 种 形式 药 命令 : 


who “<> userlog 


sort <. data 
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编写 可 以 支持 以 上 两 种 操作 的 代码 就 留 给 大 家 作为 练习 去 完成 
10.6 管道 编程 


现在 已 经 学 习 了 如 何 编写 程序 将 标准 输出 重 定向 到 文件 。 下 面 将 要 讨论 如 何 使 用 管道 
来 连接 一 个 进程 的 输出 和 男 一 个 进程 的 输入 。 图 10. 16 展示 了 管道 的 工作 原理 。 管 道 是 内 
核 中 的 一 个 单 向 的 数据 通道 。 管 道 有 一 个 读 取 端 和 一 个 写 入 端 。 实 现 who] sort 这 样 的 操 
作 ,需要 两 种 技巧 : 如 何 创 建 管道 ,以 及 如 何 将 标准 输入 和 输出 通过 管道 连接 起 来 。 


= 
= x 






图 10.16 两 个 进程 由 管道 连接 在 一 起 


10.6.1 创建 管道 
图 10. 17 所 示 即 为 一 根 管道 ， 可 以 使 用 如 下 的 系统 调用 来 创建 管道 


| pipe 
目标 创建 管道 
i & include <wnistd. h> 
函数 原型 result = pipe(int array| 2 | ) i 
$ array BERN in 类 型 数据 的 数组 
E Fee FR 
返回 值 F "m 
pipe (1] pipe 10) 





ZAN o Ee m iE 


[210,17 TES 


WN FA pipe 来 创建 管道 并 将 其 两 端 连 接 到 两 个 文件 描述 符 。array[0] 为 读数 据 端 的 文件 
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的 内 部 实现 隐 荐 在 内 核 中 ,进程 只 能 看 见 两 个 文件 描述 符 。 
图 10.18 显示 了 进程 创建 一 个 管道 前 后 的 状 次 。 前 一 张 图 ( 负 用 pype 之 前 ?显示 了 标准 


文件 描述 符 集 。 后 一 张 图 (调用 pipe 之 后 ) 显 示 了 内 核 中 新 创建 的 管道 ,以 及 进程 到 管道 的 
PAS EFE. 注意. 类似 于 open 调用 ,pipe 调用 也 使 用 最 低 可 用 文件 描述 符 。 


iB FH pipe 之 后 


调用 pipe 2 Bi 





DET miei P 


+ a wi T t - - 


内 核 创建 管道 并 设置 文件 描述 符 





HEI Eg HOS vct 
10. 18 ”进程 创建 管道 


下 面 的 程序 pipedemo. c 展示 了 如 何 创 建 管道 并 使 用 管道 来 向 自己 发 送 数 得 ， 


/* pipedemo.c ^ Demonstrates; how to create and use a pipe 
" x Effect, creates a pipe, writes into writing 
* end, then runs around and reads from reading 

x end. A little weird, but demonstrates the idea, 


» / 
4 include «stdaio. bh» 
# include <Cunistd. h> 


nain() 

( 
int len, i, apipe [2]; /x two file descriptors  «/ 
cher buf [ BUFSIZ |; /* for reading end 2 / 


/* get a pipe x/ 

if ( pipe ( apipe) == ~1 ){ 
perror( "could not make pipe"); 
exit(J); 


| 
printf("Got a pipe! It is file descriptors, ( %d $&d }\n", 


apipe[D], apipe[1]); 
/* read from stdin, write into pipe, read from pipe, print ¥/ 


while ( fgets(buf, BUFSIZ, stdin) ){ 


len = strlen( buf ); 
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if ( write( apipe[1j], buf, len) |= len)I /* send »/ 
perror( “writing to pipe"); /* down #/ 
break: /* pipe */ 

) 

for G = 0 ; ilen; i++ ) ^w wipe w; 
buffi] = °X’; 

len = read( apipe[0], buf, BUFSIZ ; /« read x/ 

if ( len == - 1»( /* From w/ 
perror( "reading fron pipe"); /* pipe »/ 
break; /* pipe */ 

) 

if ( write( 1 , bof, len) != len ){ /* eend «/ 
perrar( “writing to stdout”); /* to «/ 
break; /* pipe «/ 


| 


后 10. 19 显示 了 从 键盘 到 进程， 从 进程 到 管道 








` 凡 从 管道 到 进程 以 及 从 进程 回 到 终端 的 








数 异 传输 流 。 
1 input ^^ ”上 : 一 & 
Pd 10. 19 ppriemo. c 中 的 数据 流 
现在 已 经 学 习 了 如 何 创 建 管道 ,如何 向 管道 中 写 数 据 以 及 旭 和 何 从 管道 中 恋 取 数据 ，5 


En E ,很 少 会 有 程序 用 管道 向 自己 发 送 数据 . 
的 进程 了 。 


将 pipe 和 fork 结合 起 来 .就 可 以 连接 两 个 不 同 
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10.6.2 使 用 fork 来 共享 管道 


当 进 程 创建 一 个 管 关 之 后 ,该 进程 就 有 了 连 向 管道 两 端的 连接 。 当 这 个 进程 如 用 fork 
的 时 候 , 它 的 子 进程 也 得 到 了 这 两 个 连 向 管道 的 连接 ,如 图 10.20 所 示 。 父 进程 和 子 进 程 都 
可 以 将 数据 写 到 管道 的 写 数据 端口 ,并 从 读数 据 端口 将 数据 读 出 ,如 图 10. 21 Bros. PRA dE 
程 都 可 以 污 写 管道 ,但 是 当 一 个 进程 污 , 另 一 个 进程 写 的 时 候 , 管 道 的 使 用 效率 是 最 高 的 。 





共享 管道 ， 

Jt BLUE TU. A RT 
TEIR INE A oU A XX 
件 描述 符 指 针 数 组 


接着 进程 再 用 fork. 内 核 创建 
一 个 新 进程 并 从 父 进 程 复制 连 
接管 道 费 点 的 文件 描述 符 指针 
效 组 


两 个 进程 者 协同 管道 和 的 两 疯 





图 10. 20 共享 管道 





图 10.21 进程 之 间 的 数据 流 


下 面 的 程序 pipedemo2. c 说 明了 如 何 将 pipe 和 fork 结合 起 来 ,创建 一 对 通过 管道 来 通 
信 的 进程 。 | 


/* pipedemo2.c x Demonstrates how pipe is duplicated in fork() 


* * Parent contínues to write and read pipe, 
* but child also writes to the pipe 
x / 


4 include 二 stdio.h> 


H define CHILD MESS "了 want a cookie\n” 
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# define PAR MESS "testing. . Yin" 
Hdefine . oops(m,x) { perror(m}; exit(x); | 
maint) 
{ 
int pipetd|2 |: /* the pipe x/ 
int len; /* for write x’ 


Pi 


char buf| BUFSIZ | : fx for read x/ 


int read len; 


if ( pipet pipefd ) == 一 上 上) 


cops( "cannot get a pipe", 1); 


switch( fork() )| 
case — 1, 


oops("cannot fork", 2); 


/* child writes to pipe every 5 seconds x/ 


case Q, 
len = strlen(CHIID MESS); 
while (1){ 


if (write( pipefd|1], CHILD MESS, len) 1= len) 
cops("write", 3); 
sleep(5); 
f 


/* parent reads from pipe and also writes to pipe x/ 
default. 
len = strlen( PAR MESS ); 
while (€ 1 H 
if ( write( pipefd| 1], PAR MESS, len)!* len} 
oops "write", 4); 
$leep(1); 
read len = read( pipefd[0], buf, BUFSIZ 2; 
if ( read len — = 0 } 
break; 


writet 1, buf, read len ); 


10.6.3 (B FH pipe fork EA exec 


7S AT T SPP ae 5 ERO dn SE who 的 输出 连接 到 sort 的 输入 的 程序 。 大 家 
应 该 已 经 了解 了 如 何 去 创 建 管道 ,如 何在 进程 间 共 享 管道 ,如 何 改变 进程 的 标准 输入 以 及 如 
何 改 变 进 程 的 标准 输出 。 
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在 这 里 马 以 将 这 所 有 的 技巧 结 人 台 在 一 起 ,编写 一 个 通用 的 程序 pipe。 它 使 用 两 个 程序 的 
名 字 作 参数 ,例如 


pipe who sort 


pipe 1s head 


Tz FF A EF Boo ; 


pipe(p) 
fork) 
| 
和 + 一 一 一 -+ 
child parent 
| 
close(p [ 0j) close(p| 1 ]) 
dup2(p [1],1? dup2(p| 01,0} 
close(p [17*) close(p[ 0]) 
exec "who" exec "sort" 


程序 代码 如 下 ， 


/* pipe.c 
x Demonstrates how to create a pipeline from one process to another 
* + Takes two args, each a command, and connects 
E: av|1 ts output to input of av[ 2; 
* * usage: pipe commardi command2 
x effect; commandl | command? 
* * Limitations, commands do not take arguments 
* * uses execlp() since known number of args 
+ #* Note. exchange child and parent and watch fun 
H include <_stdio. h 


H include «unistd. hl» 
# define oops(im,x) { perror(m), exit(x); } 


main(int ac, char * * av) 


int thepipel 2], /* two file descriptors  s/ 
newfd, /* useful for pipes  x/ 
pid; /* and the pid  «/ 


if (ac l= 3}! 
fprintf(stderr, "usage, pipe cmdl cemd2Xn'"? ; 
exit( 1) - 


一 
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一 一 


| 
if ( pipe thepipe ) == -1) /* get a pipe xj 
oops( "Cannot get a pipe", 12; 


X 
/* now we have a pipe, now lets get two processes */ 
if ( (pid = fork()) == -1) /* get a proc x / 


oops("Cannot fork", 2); 


/* Right Here, there are two processes */j 


jx parent will read from pipe xj 


iE pad 90H /* parent will exec av[ 2] Fi 
close(thepipe[1]); /* parent doesrt write to pipe x 


if ( dup2(thepipe[0], 0) == -1) 


oops( "could not redirect stdin",3); 


close(thepipe|O0 j|);  /* stdin is duped, close pipe xj 
execlp( av| 2], avi 2], NULL); 
oops(av| 2], 4); 

J 


/* child execs av[ 1] and writes into pipe x/ 
close(thepipe[ 0 ]); /* child doesrt read from pipe » f 
if ( dup2(thepipe[1], 1) == 12 


oops( "could not redirect stdout", 4); 


close(thepipell]|; /* stdout is duped, close pipe x / 
execlp( av[1;/, av[1:, NULL); 
cops(av| 1], 5); 
| 
程序 pipe. c jH T II shell 一 样 的 轧 路 和 技术 来 创建 管道 。 但 是 shell FFARR pipe. c 一 样 
运行 外 部 程序 。shell 首先 创建 管道 ,然后 调用 fork 创建 两 个 新 进程 ,再 将 标准 输 人 和 输出 重 
定向 到 创建 的 管道 ,最 后 骨 通 过 exec 来 执行 两 个 程序 。 | 


10.6.4 技术 细节 : 管道 并 非 文 件 


管道 在 许多 方面 部 类 似 于 普通 文件 。 进 程 使 用 write 将 数据 写 人 管道 ,又 通过 read 把 数 
据 读 出 来 。 像 六 件 一 样 ,管道 是 不 带 有 任何 结构 的 守节 序列 。 另 一 方面 ,管道 又 与 文件 不 
[n] ,例如 文件 的 结尾 是 否 也 运用 主管 道 呢 ?9 下 列 技术 细 市 消 楚 地 阐述 了 文件 与 管道 的 相同 
SA nl ex 
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l. 从 管道 中 读数 据 

(1) 管道 读 取 阻塞 

当 进 程 试图 从 管道 中 读数 据 时 ,进程 被 挂 起 直到 数据 被 写 进 管道 。 SR iu XE Se PEE 
水 无 止境 地 等 待 下 去 呢 ? 

(2) 管道 的 读 取 结束 标志 

当 所 有 的 写 者 关闭 了 管道 的 写 数 据 端 时 ,试图 从 管道 读 取 数据 的 调用 返回 OIA A 
文件 的 结束 。 

(3) 多 个 读者 串 能 会 引起 麻烦 

管道 是 一 个 队列 。 当 进程 共管 道中 读 取 数据 之 后 , 数 乌 已 经 不 存在 了 。 如 条 两 个 进程 
都 试图 对 同一 个 管道 进行 读 操 作 ,在 一 个 进程 读 取 一 些 之 后 , 另 一 个 进程 读 到 的 将 是 后 面 的 
内 容 。 它 们 读 到 的 数 磊 必然 是 不 完整 的 ,除非 黄 个 进程 使 用 某 种 方法 来 协调 它们 对 管道 的 
访问 。 

2. 向 管道 中 二 数据 

CD 写 入 数据 阻塞 直到 管道 有 空间 去 容纳 新 的 数据 

管道 容纳 数据 的 能 力 达 比 磁盘 文件 差 的 多 。 当 进程 试图 对 管道 进行 写 操 作 的 时 想 , 此 
调用 将 挂 起 进程 二 到 管道 中 有 是 驶 的 空间 去 容纳 新 的 数据 。 如 果 进 程 想 写 入 1000 个 宁 节 ， 
而 管道 中 现在 只 能 容纳 500 个 字 节 ,那么 这 个 写 入 调用 就 只 好 等 待 直到 管道 中 得 有 500 TE 
节 空 出 来 。 如 果 某 进程 坛 图 写 100 万 字 节 , 那 结果 会 怎样 ”调用 会 不 会 永远 等 待 下 去 呢 ? 

(2) 写 人 必须 保证 一 个 最 小 的 抉 大 小 

POSIX 标准 规定 内 核 不 会 拆 分 小 于 512 字 节 的 块 。 而 Linux 则 保证 管道 中 可 以 存在 
4096 字 节 的 连续 缓存 。 如 果 两 个 进程 向 管道 写 数 据 ,并且 每 一 个 进程 都 限制 其 消息 不 大 于 
512 空 节 , 那 么 这 些 消息 都 本 会 被 内 核 拆 分 。 

(3) £r nd b e URS NE BRE DUI AUR 

如 果 所 有 的 读者 都 已 将 管道 的 读 取 端 关 闭 , 那 么 对 管道 的 写 人 人 调用 将 会 执行 失败 。 如 
时 在 这 种 情况 下 ,数据 还 可 以 被 接收 的 话 , 它 们 会 到 哪里 去 呢 ? 为 了 避免 数据 丢失, 内 核 采 
用 了 两 种 方法 来 通知 进程 :“ 此 时 的 写 操作 是 无 意义 的 ”。 首 先 ,内 核发 送 SIGPIPE HAA 
进程 。 车 进程 第 终止 , 则 无 任何 事情 发 生 。 否 则 write 调用 返回 一 1, 并 县 将 erno BH 
EPIPE, 


rr zu 


1, ERAS 

输入 7 输出 重 定向 允许 完成 特定 功能 的 程序 通过 交换 数据 来 进行 相持 协作 。 

Unix 默认 规定 程序 从 文件 措 述 符 0 读 取 数 据 , 写 数据 到 文件 描述 符 1 ,将 错误 信息 输 
出 到 文人 性 描述 符 2。 这 三 个 文件 描述 符 称 为 标准 输入 、 输 出 及 标准 错误 输出 

当 登 录 到 Unix 系统 中 ,登录 程序 设置 文件 描述 符 0.1.2。 所 有 的 连接 .文件 描述 符 
都 会 从 父 进 程 传递 给 子 进程 。 它 科 也 会 在 调用 exec 时 被 传递 。 

。 蚀 建 文件 描述 符 的 系统 调用 总 是 使 用 最 低 可 用 文件 描述 符号 。 


a 
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o. 重 定向 标准 输入 ,输出 以 及 错误 输出 意味 着 改变 文件 描述 符 0、1.2 的 连接 。 有 很 多 
种 技术 来 重 定 问 标 准 I/O. 
。 管道 是 内 核 中 的 一 个 数据 队列 ,其 每 一 端 连 接 -- 个 文件 描述 符 。 程 序 通 过 使 用 pipe 
系统 调用 人 蚀 建 管道 。 
© 当 父 进程 调用 fork 的 时 候 , 管 道 的 两 端 部 被 改制 到 子 进程 中 。 
。 只 有 有 共同 父 进 程 的 进程 之 间 才 可 以 用 管 半 连接 ， 
2. FERRA | 
传统 的 Unix 管道 在 进程 癌 进 行 数据 的 单 向 传输 。 大 类 个 进程 希望 来 回 传 递 数据 又 该 
如 何 ? 两 个 没有 关联 的 进程 或 两 个 进程 在 不 同 的 机 器 上 , 那 该 如 和 何 实 现 呢 ?在 后 面 几 音 中 ， 
将 更 加 细致 地 研究 一 下 管道 以 及 网 络 编 程 , 使 用 管道 的 黑 路 可 以 轻易 邢 扩 展 到 套 接 学 
(socket) E, 
j. 习题 


10.1 


10.2 


10. 5 


10.6 


10.7 


TSA ee shell 38 58 Resin el PEAK EE E. shell 是 使 用 自动 添加 模式 
《 见 第 5 章 ) ,还 是 简单 地 寻找 交 件 的 结尾 并 从 这 里 开始 写 数据 ? 通过 shell 脚本 
设计 一 个 试验 来 回答 这 个 问题 ， 


在 pipe.c 中 , 父 进程 运行 着 消费 数据 的 程序 , 子 进 程 运行 着 产生 数据 的 程序 。 如 
RAT RRR ARR ,那么 纺 果 有 何 差异 ?” 将 测试 语句 ifCpid 00 $89 if 
(pid==0) ,角色 就 可 以 被 换 过 来 。 这 将 会 导致 什么 情况 的 发 后? 为什么? 


若 需 要 shell RIF SIR. BER mea? 首先 ,如 何 修改 控制 流 来 识别 并 处 理 以 
管道 符号 结尾 的 命令 ? 其 次 , 若 有 许多 命令 ,它们 之 间 通 过 管道 符号 来 分 割 , 那 
M YEA ETE RUE cT 


在 pipe. c 中 , 读 进 程 sore 关闭 了 从 父 进 程 那里 复制 来 的 管道 写 数据 端 。 修 改 代 
码 让 读 进 程 不 要 关闭 管道 的 写 数据 端 。 运 行程 序 , 并 对 结果 做 出 解释 ， 


在 这 :- 章 的 开始 学 习 了 将 标准 输入 、 输 出 重 定 疝 到 文件 的 符号 。 知 道 重 定向 符 
导 和 文件 名 可 以 出 现在 命令 行 中 的 任意 地 方 , 并 且 重 定 阅 符号 和 文件 名 没有 作 
Ay ad RI. 

前 面 编写 的 shell B.E fs dT 87r vU d Be BK f Ab SER US 
He (of? GHP RA set> varlist, 结 果 又 如 何 ” 这 个 shell 会 允许 你 将 内 部 命令 
的 输出 重 定 同 吗 ” 如 何 将 此 功能 加 入 自己 编写 的 shell «pu? 


HAP fA sort dataz7 data. AAR anfapllo 这 个 命令 的 问题 何在 ? 标准 Unix 
shell 如 何 处 理 这 一 问题 呢 ? 自己 所 写 的 shell 又 该 如 何 去 处 理 这 个 问题 呢 ” 

已 经 学 习 了 如 和 何 将 程序 的 标准 输入 输出 连接 到 一 个 文件 。 上 面 所 有 的 例子 中 都 
假设 这 里 的 文件 是 常规 磁 堆 文件 。 那 么 是 否 可 以 将 输 人 输出 重 定向 到 设备 文件 
Pie? 如 果 调 用 了 close(0) 和 openl"/dev/tty",0) ,结果 会 如 何 昵 ? shell Bani 


HEAR EE tS whol /dev/tty 的 ? 


od ied al "Volle ME TT Fe lie WT FIAT eue PTT O00 * 
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10.8 ”在 pipe. c 中 ;调用 了 fork 和 exec 函数 ,但 是 并 没有 调用 wait。 这 是 为 什么 ? 
10.9 讨论 一 下 dup 与 link 的 共同 点 与 区 别 。 


4, 编程 练习 
10.10 ”修改 脚本 watch. sh ,使 它 可 以 有 更 多 的 功能 ， 
CD 除了 打印 所 有 酬 户 的 登录 和 注销 情况 外 ,新 的 版 本 要 求 可 以 通过 命令 行 参 
数 米 传递 一 个 包含 要 监控 的 用 户 列 表 文 件 。 
(2) 修改 后 的 程序 仅仅 当 有 新 的 用 上 户 登 录 或 注销 时 ,将 结果 打印 出 米 . 而 不 古 
每 次 循环 都 打印 一 些 内 容 。 
(3) who ft E T 5] 8 8 Pan NRI OS see TB) SESS PRSE. af REX M IH P? 
fr BE + hig ORE PRR. 修改 程序 使 其 仅仅 当 用 户 从 登录 状态 变 
BY AR RIA AST ASR AG SR ,而 不 去 考虑 终 疹 的 变化 。 
(4) 早期 的 Unix 版 本 将 数据 存储 在 当前 日 严 下 的 文件 prev 和 curr R, 3 H Æ 
程序 停止 运行 时 ,并 没有 对 这 两 个 文件 伐 处 理 . 这样 的 没 计 有 了 哪些 缺点 ? 
修改 脚本 ,使 其 使 用 临时 的 文件 ,并 在 结束 运行 的 时 候 删 除 它 们 。 看 一 下 如 
fei fi AR shell 中 的 trap 命令 以 及 mktemp 命令 。 


10.11 修改 whotofile. c 程序 ,使 其 将 who LL Kup 到 一 个 文件 的 末尾， 确保 
在 此 文件 不 存在 时 ,程序 照样 可 以 正常 运行 。 


10. 12 编写 一 个 名 为 sortfromfile. c 的 程序 ,将 sort 命令 的 输入 重 定 问 ,使 其 从 文件 中 
读 和 数据。 文件 名 由 人 靖 令 行 参 数 来 指定 。 


10.13 URE pipe. c FAP ACME IE. BRAS AY Unix 程序 可 以 接收 三 个 程序 名 
称 作为 参数 ,并 让 它们 以 管道 的 方式 交互 数据 。 命 令 


Pipe3 who sort head 


应 该 和 who|sort|head 起 到 相同 的 作用 。 
10.14 PR EESBURES pipe? 使 其 可 以 处 理 任意 多 的 参数 。 
10.15 tee 工具 允许 重 定向 数据 到 文件 并 且 将 数据 传递 给 另 -- 个 程序 。 例如， 


who|tee userlist |sort > list2 
产生 一 个 未 排序 文件 和 一 个 排序 文件 : userlist Al list2, fF tee 的 参数 是 一 个 
文件 名 ,可 以 从 参考 手册 得 到 更 详细 的 信息 。 编写 一 个 名 叫 progtee 的 程序 来 
重 定 向 数据 到 程序 ,同时 通过 管道 将 数据 传递 给 另 一 个 程序 。 例 如 命令 ， 

who|progtee mail smith sort|progtee mail - s "hello" 

root <> list? 

将 一 个 未 排序 的 列表 作为 邮件 发 给 smith ,将 排 好 序 的 文件 发 给 root, ELE — i 
排 好 序 文 件 的 符 份 放 到 文件 list2 中 。 
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件 。 本 童 中 似乎 暗示 进程 并 没有 方法 米 了 解 文 件 描述 符 的 指向 。 其 实 这 并 不 
iE. FPR isattyCEOD Al EA HH SE CH] Br: 者 文 件 描述 符 f 纪 指向 终端 , 则 函数 
返回 为 true,isatty 使 用 系统 调用 fstat。 阅 读 一 下 关于 [stat 的 介绍 ,并 日 用 它 
$3 — TRR isaregfileCid) ,使 其 在 fd 8 imp HF 39 A sc (IR E true, 


第 11 章 连接 到 近 端 或 远 端的 进程 : 
服务 器 与 Socket (EE E^.) 


dc 





概念 和 技巧 

。 客户 /服务 器 模 增 

* 用 管道 来 双向 通信 

+ Dp la) VERE Ccoroutines) 

”文件 ”进程 的 相似 性 

© ÍT A E socket ,为 什么 需要 socket, al fif f& FH socket 
。 网 络 服务 

* 用 socket 编 瑟 客户 /服务 此 程序 
相关 系统 调用 和 函数 

« fdopen 

* popen 

e socket 

e bind 

e listen 

* accept 


* connect 


11.1 产品 和 服务 


像 制造 商 利 用 传送 带 在 工大 之 间 传 递 产品 一 样 ,Unix 程序 员 可 以 通过 管道 米 传 送 数 字 
信息 。 
并 非 所 有 的 商务 这 程 都 是 像 工 三 的 生产 线 一 样 是 单 向 流动 的 , 某 些 形式 的 通信 方式 
RGA. SR PRR PHN ,律师 还 有 兽医 。 ARIK ARS TIE IEE ik BB 
医 那 边 ,或 是 将 文档 通过 e-mail 发 给 律师 之 后 ,只 需 等 竺 他 们 把 处 理 好 的 东西 发 回 ,而 并 不 
需要 像 汽 车 工厂 里 的 工人 那 首 把 车 传递 给 下 一 个 工人 。 在 这 个 例子 中 ,需要 由 其 他 人 完 
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成 的 工作 就 称 之 为 服务 ,而 自己 则 是 服务 的 客户 。 

上 面 的 例子 跟 Unix 有 什么 关系 呢 ? Unix 中 的 管道 可 以 把 数据 从 一 个 进程 传送 到 万 外 
一 个 进程 。 进 程 和 管道 不 但 类 似 于 二 条 生产 线 来 完成 产品 ,还 类 似 于 一 个 大 的 服务 产业 ， 
本 章 将 关注 于 进程 间 的 数据 通信 ,这 也 是 客户 /服务 器 编程 的 基础 知识 。 


11.2. 一 个 简单 的 比喻 : 饮料 机 接口 


程序 处 理 信 息 就 像 人 们 消耗 饮料 一 样 . 以 图 11. 1 中 的 自动 碳酸 饮料 机 为 例 , 在 你 投 
和信 硬币, 按 下 按钮 之 后 ,饮料 束 自 动 流出 。 在 此 过 程 中 ,饮料 机 内 的 分 配器 在 做 什么 工作 
BE? 在 饮料 机 内 .应 该 有 一 桶 碳酸 水 和 男 一 捅 浓缩 的 饮料 汁 水 , 当 按 下 按钮 时 ,将 激活 一 
个 配制 原材料 并 不 断 地 传送 出 产生 的 磋 酸 饮料 的 过 程 。 另 一 种 方法 则 是 只 需要 将 一 浴 预 
先 配 制 好 的 磋 酚 饮料 装 到 一 个 抽水 泵 上 , 校 下 按钮 这 个 动作 就 简单 地 将 饮料 捉 出 并 送 给 
外 面 的 杯子 。 





RUE T EHE 来 日 存储 部 分 
图 11. 1 动态 产生 或 来 自 柄 态 饮 料 


就 像 兢 酸 饮 料 分 配器 一 样 、Unix 提供 一 个 接口 米 处 理 可 能 来 自 不 同 数 据 源 的 数据 ,如 
11.2 所 示 。 


A JA 2S RY) c te wh 


| Gr x (d 
2. RA 

3. Td 

4. Sockets 





图 11.2 一 个 接口 和 不 同 的 数据 源 


© O 2) 磁盘 /设备 文件 

用 open 命令 连接 ,用 read 和 write 传递 数据 。 

* (3) 管 道 

用 pipe 命令 创建 ,用 fork 共享 ,用 read 和 write 传递 数据 。 


AG 连接 到 近 端 或 远 端 的 进程 : 服务 器 与 Socket( 套 接 字 ) " 327 * 


一 一 一 一 








+ (4)Sockets 
用 socket, listen 和 connect 连接 ,用 read 和 write 传递 数据 ， 


11.3 be: Unix 中 使 用 的 计算 器 


几 平 每 个 版 本 的 Unix 都 包含 bc 计算 器 ,尽管 这 些 计算 器 的 版 本 有 些 差异 。 bc 计算 部 
"P tu Ed 、 握 环 和 歼 数 的 功能 ,并 如 在 第 1 章 中 所 看 到 的 那样 支持 对 长 整数 的 处 理 ， 


S be 

17^123 
22142024630120207359320573764236957523345603216987323173224049701X 
6947292822996637496750906355872025391170927394632063938187990037V 
220685580536286573569713 


4$ ITR EE B Ix | E S EN AEF UAR SE 

lL. bc tX — dT E 

一 个 计算 器 程序 分 析 它 的 输 人 ,执行 操作 ,然后 将 输出 打印 出 来 。 大 部 分 版 本 的 bc 程序 
家 只 分 析 输 入 ,并 不 执行 操作 守 。 其 实 ,bc 在 内 部 启动 了 dc 计算 器 程序 ,并 通过 管道 与 其 进 
THE. de 是 一 个 基于 栈 的 计算 器 , 它 需 要 用 户 在 指定 具体 的 操作 符 之 前 , 先 输 人 所 要 操作 
的 数据 。 例 如 ,用 户 输 人 2 2 十 来 代表 2 加 2 的 操作 ， 

图 11.3 ok f bc 如 何 来 处 理 2 十 2 的 过 程 : 用 户 输 人 2 十 2. 然 后 按 回 车 。bc 从 标准 条 
人 读 黑 该 表达 式 .分 析出 数据 和 操作 符 , 接 下 来 把 一 系列 的 命令 “2”.“2”,“ 十 "和 p 传 给 de, 
dc 则 将 数据 入 栈 . 运 行 加 操作 ,最 后 把 栈 顶 的 数值 送 到 标准 输出 ， 





的 11.3 be ffl dc 作为 协同 进程 


bc 从 连接 到 dc 标准 办 出 的 管道 上 读 取 结果 ,再 把 结果 和 转发 给 用 户 。 这 样 的 话 ,bc 甚至 
都 不 舌 要 持 有 变量 。 如 果 用 户 输 人 x 二 2 十 2,bc 告诉 dc 执行 该 操作 并 且 把 结果 存 到 宕 存 器 
xP, aS bc -~c 可 以 显示 分 析 锅 和 传 给 计算 器 的 数据 ;就 连 GNU 版 本 的 bc 也 是 把 用 户 的 
输入 转换 成 基于 栈 的 后 组 表达 式 ， 

2， 从 be 方法 中 得 到 的 思想 

(1) 客户 /服务 器 模型 

bc/dc 程序 对 是 客户 /服务 器 模型 程序 设计 的 一 个 实例 。dc 提供 服务 : TEL dc 所 识别 
的 语言 是 众所周知 的 逆 波 兰 表 示 法 。be 和 dc 之 则 通过 标准 输 人 stdin 和 标准 输出 stdout 进 
ITAA. be 提供 用 户 界面 ,并 使 用 dc 提供 的 服务 。 这 里 bc 被 称 为 de 的 客户 。 


D CNU 版 本 的 bc FRAT ARE BD. 
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这 两 个 部 分 是 根本 上 独立 的 程序 。 可 以 使 用 不 同 版 本 的 dc, 这 并 不 影响 bc 正常 工作 。 
类 似 地 ,可 以 编写 一 个 图 形 界面 的 bc, 而 仍 用 dc 作为 计算 引 繁 。 甚 至 可 以 用 这 样 一 个 程序 
来 替换 de、 该 程序 先 分 析 dc 所 识别 的 语言 ,然后 把 它 所 区 做 的 工作 传 给 可 能 位 于 另 一 台 更 
高 速 计算 机 上 的 程序 ， 

(2) 双向 通信 

客户 /服务 器 模型 不 同 于 生产 线 的 数据 处 理 模型 , 它 要 求 一 个 进程 既 跟 另 一 个 进程 的 标 
准 输入 也 要 和 它 的 标准 输出 进行 通信 ， 传统 的 Unix 的 管道 只 是 单方 向 地 传送 数据 中, 攻 11. 
3 给 出 了 bc 和 dc 之 间 的 两 个 管道 ,其 中 上 古 的 管道 把 一 些 计 算命 令 传 给 dc 的 标准 输 人 ,下 
面 的 管道 把 dc 的 标准 输出 传 给 be. 

(3) 永久 性 服务 

be 只 是 让 单一 的 de 进程 处 于 运行 状态 ,这 就 不 同 于 shell 程序 ,这 种 程序 中 的 每 个 用 户 命 
令 孝 创建 一 个 新 的 进程 。bc 程序 持续 不 断 地 和 de 的 同一 个 实例 进行 通信 .把 用 户 的 输入 转换 
成 命令 传 给 下。 他 们 之 间 的 关系 并 不 同 于 标准 区 数 中 所 使 用 的 调用 返回 机 制 。 

bc/ dc 对 第 称 之 为 协同 进程 (coroutines) 以 用 来 区 别 于 子 程序 (subroutines)。 两 个 程序 
部 持续 运行 . 当 其 中 的 一 个 程序 完成 自己 的 工作 后 将 把 控制 权 传 给 另 一 个 程序 。 be 的 任务 
是 分 析 输 人 及 打印 :而 dc 则 负责 计算 。 


11.3.1 编写 be: pipe、fork、dup、exec 


图 11.4 显示 了 内 核 将 用 户 连 接 到 be 并 将 be 连接 到 :dc 的 数据 连接 。 这 里 以 该 图 作为 
编号 下 面 代码 的 指南 ，。 

(1) 创建 两 个 管道 

(2) 创建 一 个 进程 来 运行 de. 

(3) 在 新 创建 的 进程 中 , 重 定 向 标准 输入 和 标准 输出 到 管道 ,然后 运行 exec de, 

CA) 在 父 进 程 中 , 读 到 并 分 析 用 户 的 输入 ,将 命令 传 给 de, de 读 取 响应 ,并 把 响应 传 给 
ALP. 





图 11.4 bede MAK 


有 一 些 管道 也 能 双向 传输 数据 ( 见 小 结 中 编程 练习 11. 11)， 
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下 面 是 tinybe. c 的 源 程序 ,这 是 一 个 简单 版 本 的 be. FH sscanf 分 析 输 入 ,并 通过 岗 个 管 
道 与 dc Xi fei. 


js tinybc.c * a tiny calculator that uses dc to do its work 
x x * demonstrates bidirectional pipes 
x He * input looks like number op number which 
* X tinybc converts into number in number n op An p 
x ox and passes result back to stdout 
Ax 
xx 二 一 一 -一 一 一 一 -一 一 一 + SSS SS See + 
x x stdin 0 “>= = pipetodc 252-— | 
* «X | tinyhe | i dc 一 | 
x ¥ stdout «71 <== pipefromdc ==<7 | 
* x 十 一 一 一 一 一 - 一 一 一 -+ 1 一 一 一 一 一 一 一 一 一 一 + 
xo 
*ox * program outline 
* x a. get two pipes 
* x b. fork (get another process) 
Xo C. in the de - to- be process, 
x x connect stdin and out to pipes 
xx then execl de 
xx d. in the tingbc - process, no plumbing to do 
*x just talk to human via normal io 
xx and send stuff via pipe 
X x e. then close pipe and dc dies 
x + x note: does not handle multiline answers 
x x/ 


# include  «stdio.h 


ft define cops(m,x) ! perror(m): exit(x): | 
maing } 
{ 
int pid, todel2|, fromdc[2]; /* equipment * / 


‘x make two pipes */ 


if ( pipe(todc) == -1 || pipe(fromdc) == -1) 
oops( "pipe failed",1); 


/* get a process for user interface x/; 


if ( (pid = fork()) == -1) 


oops "cannot fork", 2); 





+ 330 * Unix/Linux RWE 3C eae E 


—— ne es ee —— — 





if ( pid == 0) /* child is dc «/ 
be dc(todc, fromdc); 

else | 
be bc(todc, fromdc); /* parent is ui #/ 
wait {NUL} - /* wait for child #/ 


be dc(int in[2], int out[2])) 


fx 


} 


* 


关子 


set up stdin and stdout, then execl dc 


/* setup stdin from pipein */ 


if ( dup2Z(in[0],0) == -1) /* copy read end to D x/ 
oops("dc, cannot redirect stdin",3); 

close(in[O0 D; /* moved to fd 0 x/ 

close(in[1]; /* won't write here #/ 


/* setup stdout to pipeout x/ 


if ( dup2(out[1], 1) == -1) /* dupe write end to 1 x/ 
gops( "de, cannot redirect stdout",45; 

close(outl 15; /* moved to fd 1 «/ 

close(Cout[0 ]) ; /* won't read from here xr 


/* now execl dc with the - option x/ 
execlpi("dc", "do", "— ". NULL 5: 
oops( "Cannot run dc", 55; 


be bc(int todc[2], int fromdc[2 ]) 


|! 


i 


x 
* 


* 


#/ 


read From stdin and convert inLo to REN, send down pipe 
then read from other pipe and print to user 
Uses fdopen() to convert a file descriptor to a stream 
int numl, num?; 
char operation| BUFSIZ;, message| BUFSIZ], * fgets(); 
FILE + fpout, * fpin, * fdopent); 
/* setup */ 
close(Ctodc[0]); ‘* won't read from pipe to dc «/ 


close(fromdc|1)); /* won't write to pipe from dc x/ 
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fpout = fdopent todc[1],"w" ); /* convert file desc 一 +, 
fpin = fdopen( fromdci ol, "r" ); /* riptors to streams x/ 
if ( fpout == NULL ;| fpin == NULL) 


fatal("Error convering pipes to streams"); 

/* main loop x/ 

while ¢ printf("tinybc; "), fgets(imessage,BUFSIZ,stdin) ! = 
NULL )1 


/* parse input «/ 

if ( sscanf(message,"td%[- + #/*]%d", 
enunt operation, &rum2)! = 351 
printf( "syntax errorin"):; 


continue: 


if ( fprintf( fpout , "d\n & din & cXnpin", numi, num2, 
* operation ) == EOF > 
fatal( "Error writing"): 
fflush( fpout ); 
if ( fgets( message, BUFSIZ, fpin ) == NULL ) 
break; 

printf("$d $e $d = *s", nml, * operation , num2, message); 
! 
foclose(fpout): /* close pipe */ 
fclose(fpin); /* do will see EOF «/ 

f 


fatal( char x mess| | > 
fprintf(stderr, "Error. % sin", mess); 
exit(1); 


下 面 是 tinybe 的 运行 过 程 : 


$s cc tinybc.c - o timybc ; . /tinybe 
tinybc: 2 tZ 

2*1 2-724 

tinybc. 55^5 

5545 = 503284375 

tinybc: 


仔细 观察 程序 的 输出 ,看 一 看 哪 一 部 分 是 来 自 于 哪个 程序 。tinybe 产生 了 提示 符 并 再 一 
次 显示 出 算术 表达 式 。 计 算 的 结果 是 由 de 产生 的 字符 串 ,tinybc 只 是 从 管道 中 读 取 该 字符 
串 然 后 把 它 传 给 输出 ， 
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11.3.2 对 协同 进程 的 讨论 


其 他 的 一 些 Unix 工具 是 否 也 能 被 看 成 协同 进程 呢 ? sort 工具 能 否 被 当做 协同 进程 使 
Hj? 答案 是 否定 的 。 在 sort 产生 输出 之 前 , 它 读 取 文件 中 所 有 的 数据 。 通 过 管道 来 传送 文 
件 结尾 标志 的 惟一 途径 是 将 写 数 据 端 关闭 。 一 旦 关闭 了 写 的 进程 ,就 不 能 再 传送 其 他 需 疤 
排序 的 数据 了 。 

从 男 一 方面 讲 ,dce 是 逐 行 处 理 数 据 和 命令 的 。 与 de 的 交互 很 简单 并 可 预测 。 当 需要 dc 打 
印 一 个 数据 时 ,将 会 得 到 一 行文 本 。 当 需要 dc 把 数据 压 栈 时 ,不 会 有 啊 应 被 传 冉 。 

一 个 客户 /服务 器 模型 程序 此 成 为 协同 系统 必须 有 明确 指明 消息 结束 的 方法 ,并 且 程 序 
必须 使 用 简单 并 可 预测 的 请 求 和 应 答 。 


11.3.3 fdopen: 让 文件 描述 符 像 文件 一 样 使 用 


在 tinybe. c ' flt FH T FE eR fdopen, fdopen 与 fopen 2S fpi. i& [0] —1- FILE * 类 型 的 
值 , 7S EA EE e BR EA c PE FF MF AIHER BX 

使 用 fopen 的 时 候 , 将 文件 名 作为 参数 传 给 它 。fopen 可 以 打开 设备 文件 也 可 以 打 关 常 
规 的 磁 盟 文件 。 如 只 知道 文件 描述 符 而 不 清楚 文件 名 的 时 候 可 以 使 用 fdopen 命令 。 例 如 在 
管道 的 例子 中 ,把 一 个 通 问 管道 的 连接 转换 成 FILE « 类 型 值 之 后 ,就 可 以 使 用 标准 组 存 的 
IO 操作 米 对 其 进行 操作 了 。、 注 意 Unybe. c 是 如 何 使 用 fprintf 和 igets 来 通过 管道 和 de 进 
行 通 优 的 。 

使 用 fdopen 使 得 对 远 端 的 进程 的 处 理 就 如 同 处理 贡 规 文 件 一 样 。 下 一 节 将 削 析 popen 
必 数 ,此 函数 通过 封装 pipe. fork, dup 和 exec 等 系统 调用 使 得 对 程序 和 文件 的 操作 变 成 了 
EF, 


11.4 popen: 让 进程 看 似 文 件 
这 一 节 将 继续 学 习 一 个 程序 如 何 通 过 和 另外 一 -个 进程 通信 来 得 到 服务 。 本 节 还 将 剖析 
popen HE py. HR popen 及 其 工作 原理 ,最 后 给 出 popen 实现 版 本 . 
11.4.1 popen 的 功能 
fopen 打开 一 个 指向 文件 的 带 组 存 的 连接 


FILE + fp; /* a pointer to a struct «/ 
fp-fopen("filel", "r"j; /* args are filename, connection type */ 
c-getc(fp); /* read char by char «/ 
fgets(buf,len,fp); /* line by line x/ 

fscanf(fp," € dds s", &X,&y, x); /* token by token #/ 

fclosetfp); /* close when done x/ 


fopen fi; E Bj SAR JE Bt PE Jg 9r. 文件 名 和 连接 类 型 (例如 “TrT” Aw “a, popen 
看 上 去 跟 fopen 很 类 做 。popen 打开 一 个 指向 进程 的 带 缓冲 的 连接 : 


第 ll 


FILE« fp; 

fp * popen( "1s", "r") 
Fgets(buf len, fp) ; 
pclose¢Fp) ; 


E RPT Mise vee, 服务 器 与 Socket RF) a ggg s 


/+ same type of stroct x/ 
/x args are program name, connection type «/ 
/= exactly the same functions */ 


/* close when done #/ 


图 11.5 显示 了 popen 和 fopen 之 问 的 相似 性 。 两 者 使 用 相同 的 语法 格式 ,并 具有 相同 
的 返回 值 类 型 。popen 的 第 一 个 参数 是 要 打开 的 命令 的 名 称 ; 它 可 以 是 任意 的 shell 命令 。 
第 二 个 参数 可 以 是 "r" 或 “w” (RRS Ea”, 








popen ("Is". "r^) 
fopen ("file", ^r^) 


图 11.5 fopen 和 popen 


下 面 的 程序 将 whol sort (EA 41g Us ,通过 popen 来 获得 当前 用 户 排 序列 表 


/* popendemo. c 


4 demonstrates how to open a program for standard i/o 
» importent points, 
x l. popen() returns a FILE » , just like fopen() 


a 2. 


J 


# include < stdio. 


the FILE « jt returns can be read/written 
with all the standard functions 


, you need to use pclose() when done 


h> 


B include < stdiib. b> 


int main() 
( 
FILE — «fp; 


char bu£[ 100]; 


int i = Q; 


fp = popen( "who|sort", "r"); /* open the command »/ 


while ( fgets( buf, 100, fp) f= NULL; /x read from command x/ 
printf("*3d &s", it* , buf); /x print data x/ 


pelose( fp); 


return 0; 


/* IMPORTANT! «/ 
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第 二 个 例子 将 popen 和 邮件 程序 相连 接 ,用 来 提示 用 户 一 些 系统 点 障 : 


/* popen ex3.c 

* shows how to use popen to write to a process that 
x reads from stdin. This program writes email to 

* two users. Note how easy it is to use fprintf 

* to format the data to send. 


: 
a i 


# include  «—stdio.h— 


maing} 


t 
FILE * fp; 
fp = popen( "mail admin backup", "w" ); 
fprintf( fp. "Error with backup!! in" 5; 


pciose( fp >; 
l, 


pclose 命令 是 必须 的 。 

当 完 成 对 popen 所 打开 连接 的 读 写 后 ;必须 使 用 pclose 关闭 连接 ,而 不 能 用 fclose。 进 
程 在 产生 之 后 必须 等 待 退出 运行 ,否则 它 将 成 为 僵尸 进程 (6zombie)。 而 pelose 中 调用 了 
wait 函数 来 等 待 进程 的 结束 。 
11.4.2 实现 popen: 使 用 fdopen $5 > 

popen aay T. E69? MAKERE? popen 运行 了 一 个 程序 并 返回 指 癌 该 程序 标准 
输 人 或 标准 输出 的 连接 。 

这 里 需要 一 个 新 的 进程 来 运行 程序 ;所 以 让 用 到 fork 命令 。 需 要 一 个 指 问 该 进程 的 连 
接 , 因 此 需要 使 用 管道 。 并 日 使 用 dopen 命令 将 一 个 文件 描述 符 定向 到 缓冲 流 中 。 最 后 ,在 
该 进程 中 要 能 够 运行 任何 shell 命令 ,所 以 要 用 到 exec。 但 是 会 运行 什么 程序 呢 ? 惟一 能 够 
运行 任意 shell 命令 的 程序 是 shell 本 身 即 binysh。 为 了 使 程序 员 可 以 方便 的 使 用 ,sh 支持 
-c 选项 ,用 以 告诉 shell 执行 革命 令 然 季 退出 ， 例 如: 


sh -c "who| sort" 


告诉 sh 执行 命令 行 who|sort, 如 图 11.6 所 示 。 
这 里 合并 了 pipe fork dup? 和 exec 等 系统 调用 ,其 流程 如 下 : 


pipe(p) 
forki} 


汪汪 depu tet fL dee + 
close(p[1 |); closeCp[ 0D; 


fp 
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fdopen(p[ 0|,"r")y; 


return fp; 
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dup(p[ 1,1); 
close(p| 1); 
exec("/bin/sh","sh","— c", cmd, NULL) ; 


eh -c "la" 






wia m A! 





iB 


—— = 


Kj 11.65 从 shell fg S "PiERX 


下 面 的 程序 popen. c 是 上 述 访 答 的 一 个 实现 ， 


/* popen.c 一 a version of the Unix pop&u(? library funcrion 


E 


其 


K 


a 


K 


x 


x / 


FILE + popen( char * command, char x mode ) 


command is a regular shell command 


node is nail Or aqu" 


returns a stream attached to the command, or NULL 


execls "sh" "— c" command 


todo, what about signal handling For child process? 


d include <stdio.h> 
8 include «signal. h> 


H def ine READ 0 
H define WRITE 1 


FILE + popen(const char * command, const char ~» mode) 


( 


int pfp[2], pid; 

FILE x fdopen(), * fp; 

int parent end, child end; 
if ( s mode == 'r' )l 


parent end = READ: 

child end = WRITE ; 
| else if ( *» mode == 'w' )t 

parent_end = WRITE; 

child end = RPAD ; 
} else return NULL ; 


if ( pipe(pfp) == -1 ) 
return NULL; 


/* the pipe and the process x/ 


/* fdopen makes a fd a stream «/ 


/* of pipe «/ 


/* figure out direction */ 


/* get a pipe »/ 


ss — ss me + ma nen 
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if ( (pid = fork()) == - 14 fx and a process ¥/ 
close(pfp[0]?; /* or dispose of pipe */ 
closetpfp[1]); 
return NULL; 

} 

jx 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 perént code here e ced oues fees enge eee uhi 


‘x need to close one end and fdopen other end +/ 


if (C pid > 0 014 


if (closeC pfp[child end]? -= -1> 
return NULL: 


return fdopen( pfp|parent end] , mode) ;/* same mode «/ 


fe --------------- child code here --- 759 5 o emen xj 


/* need to redirect stdin or stdout then exec the cmd */ 


if ( close(pfp| parent end) == -1 )/» close the other end +/ 
exit(1); /* do NOT return +; 

if ( dup2(pfp[ child end], child end) == -1) 
exit(1); 

if ( close(pfp[child end]) -- -1) ‘x done with this one &/ 
exit(l); 


execlí "^bin/ ch IT : "eh p 


exit(l5; 
I 


/x all set to run cmd x; 


"—c", command, NULL 3; 


该 版 本 的 popen xT fa e LE inf Ab RED EA 9L EE? 
11.4.3 访问 数据 ; FW A RO (API) ARS 88 


[open 从 文件 获得 数据 ,而 popen 从 进程 获得 数据 . 这 里 主要 关注 一 下 数据 访问 的 普通 
问题 并 对 三 种 实现 方法 进行 比较 。 将 以 获取 登录 系统 的 用 户 列 表 为 例 来 比较 三 种 访问 数据 


的 方法 。 


* 方法 1; 从 文件 获取 数据 

可 以 通过 读 取 文件 来 获取 数据 。 第 2 章 所 写 的 who 程序 就 是 从 ump 文件 中 读 取 数据 的 ， 
基于 文件 的 信息 服务 并 不 是 很 完美 。 客 户 问 程序 依赖 于 特定 的 文件 格式 和 结 网 体 中 的 特定 成 
DAER. FAB Linux 头 文件 定义 中 utmp 结构 体 的 几 行 代码 清楚 地 展示 丁 这 一 点 ， 


/*Backwards compatibility hacks. */ 


H define ut name ut user 


第 11 意 连接 到 近 端 或 远 端 的 进程 : 服务 器 与 Socke (HEF) 3 


=. 方法 2: 从 函数 获取 数据 

可 以 通过 调用 函数 来 得 到 数据 .一 个 库 函 数 用 标准 的 函数 接口 来 封装 数据 的 格式 和 
位 置 。Unjx 提供 了 读 取 utmp 文件 的 函数 接口 。getutent 的 帮助 信息 描述 了 读 取 ump 数 
据 闫 晃 数 的 细节 。 这 样 的 活 , 就 算 底层 的 存储 结构 变化 了 ,使 用 这 个 接口 的 程序 仍 能 正常 
工作 。 

使 用 登 于 应 用 程序 接口 (API) 的 信息 服务 也 并 不 一 定 是 最 好 的 方法 。 有 两 种 方法 可 
以 使 用 库 孙 数 。 一 个 程序 可 以 使 用 静态 连接 来 包含 实际 的 销 数 代码 。 但 是 这 些 晃 数 有 可 
能 包含 的 并 不 是 正确 的 文件 名 或 文件 格式 男 一 方面 ,一 个 程序 可 以 昱 用 共享 库 中 的 消 
数 .但 是 这 些 共 齐 库 也 并 不 是 安装 在 所 有 的 系统 上 ,或 者 其 版 本 并 不 是 程序 所 要 使 用 的 
RE. 

”方法 3: 从 进程 获取 数据 

第 三 种 方法 是 从 进程 中 读 取 数据 。bc/dc 和 popen 例子 显示 了 如 何 创 建 一 个 进程 到 另 
外 一 个 进程 的 连接 。 一 个 要 得 到 用 户 列 表 的 程序 可 以 使 用 popen 来 建立 与 who 程序 的 连 
接 。 由 who 命令 来 负 资 使 用 正确 的 文件 名 和 文件 格式 以 及 正确 的 库 顺 数 ,而 不 是 你 的 程序 。 

润 用 独立 的 程序 获得 数据 还 有 其 他 的 好 钼 。 服 务 器 程序 可 以 使 用 任何 程序 设计 语言 编 
fj; shell MAC Java 或 是 Perl 都 可 以 。 以 独立 程序 的 方式 实现 系统 服务 的 最 大 好 处 是 客 
产 端 程序 和 服务 器 端 程序 可 以 运行 在 不 同 的 机 器 上 。 所 有 要 做 的 只 是 和 不 同 机 器 上 的 一 
进程 相连 接 。 


11.5 socket: 与 远 端 进程 相连 


管道 使 得 进程 向 其 他 进程 发 送 数据 就 像 向 文件 发 送 数据 一 样 容易 ,但 是 管道 具有 两 
个 重大 的 缺陷 。 管 道 在 一 个 进程 中 被 创建 ,通过 fork 来 实现 共享 。 因此 ,管道 只 能 连接 相 
关 的 进程 ,也 只 能 连接 同一 台 主 机 上 的 进程 。Unix 提供 了 另外 -- 种 进程 间 的 通信 机 制 
socket, 
socket 允许 在 不 相关 的 进程 问 创建 类 似 管道 的 连接 ,甚至 可 以 通过 socker 连接 其 他 主 
机 上 的 进程 (如 图 11.7 所 示 )。 本 节 将 学 习 socket 的 基础 知识 ,理解 如 何 用 socket 连接 不 同 
主机 上 的 客户 端 和 服务 器 端 ， 其 思想 就 跟 打 电话 查询 当地 时 间 一 样 简单 ， 





进程 


socket 





11.7 gm x ute 
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1.5.1 ”类比 :“ 电 话 中 传 来 声音 : 现在 时 间 是 ……” 

于 多 城市 都 没有 提供 时 间 服 务 的 电话 号 友 。 只 要 拨打 该 号 吗 , 机 家 将 负 次 告诉 你 该 城 
市 的 时 间 。 它 是 如 何 工作 的 呢 ? 如 果 想 建立 自己 的 时 间 服 务 ,该 如 何 做 呢 》 可 以 采用 图 11 
8 中 所 摘 述 的 比较 简单 的 方法 。 你 坐 在 办 公 室 里 ,将 一 个 钟 挂 在 墙 上 来 扮演 提供 时 间 有 最 务 的 
服务 器 。 你 所 要 遵循 的 步 又 和 Unix 中 基于 socket 建立 时 间 服 务 器 的 步骤 完全 一 致 。 下 面 ， 
16 VEA D] Ie xx 675 E 
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建立 服务 
I EI iE 等 待 请 求 
ARRA 7777777777000 T 接收 请 求 
ik e aug ik EYRE 
挂 断 FEW 


图 11.8 BRI S 


}.， 建立 服务 及 与 服务 相关 的 操作 

且 类 好 其 安 闭 了 你 自己 的 时 钟 ,如 何 建立 和 燥 作 时 间 服 务 器 呢 ? 

(1) 建立 服务 

RRS TLE 3 THR. 

”获取 一 根 电 话 线 

自 先 , 尖 要 一 根 毛 自 公用 电话 网 上 的 电话 线 来 连接 办 公 桌 旁 墙 上 的 插座 。 该 电话 线 和 
插座 使 你 可 以 连接 到 电 活 网 上 , 接 下 来 外 面 的 呼叫 可 以 被 传送 到 你 的 办 公 梨 。 议 里 的 插座 
通常 饭 称 为 通信 端点 (endpoint of communication) 。 下 一 次 如 果 需 加 在 家 里 安装 电话 线 ,可 
以 辣 电 话 局 申请 安装 一 个 通信 端点 。 

© 为 电话 线 申 请 号 码 

符 户 端 寄 要 通过 邑 叫 一 个 电话 号 码 连 接 到 你 的 通信 端点 电话 网 络 以 电话 号 码 来 区 分 
BP Hs BUS EE. 从 这 个 类 比 本 身 考 虑 ,设想 你 是 在 一 个 大 的 商务 系统 中 ， 除了 时 间 服 务 以 
外 还 需 提 供 其 他 的 服务 。 因 此 ,每 个 插座 要 以 电话 号 一 个 分 机 号 码 来 标识 ， 

例如 : 你 的 号 码 可 能 是 617—999—1 234.4) HL 4 EE 8080, 电话 号 码 标 识 了 你 网 办 公 室 
所 在 的 大 楼 的 号 码 ,扩展 号 码 8080 标识 了 该 楼 中 每 个 aaa — TS KIRK. 
个 分 机 号 码 来 标识 你 的 服务 ,这 是 一 个 重要 的 和 机制， 

”处 理 接 人 电话 

你 可 能 使 用 的 是 无 来 电 显示 的 电话 。 你 的 服务 不 带 要 上 述 类 型 的 电话 服务 。 但 必须 通 


第 11 章 连接 到 近 端 或 下 端的 进程 : 服务 器 与 Socket EO * du * 








mS PR TE E us £u gu A RAE ACRI nl dS E — 4 B9 3E HI 7 7 
A BOE Ho HR SUTRA EEE. AAA. 3€ socket 中 也 使 用 
I BA IBS EM. SAS SBMA. 

(2) 与 服务 相关 的 操作 

与 时 间 服 务 相 关 的 操作 是 包含 以 下 3 个 步骤 的 一 个 循环 。 

» 等 行 呼叫 

等 竺 在 那儿 ,不 做 任何 事情 二 到 有 呼叫 进来 。 从 技术 的 戎 上 度 讲 , 邯 被 阴 塞 在 一 个 呼叫 
上 。 当 一 个 呼叫 进来 ,你 解除 阻塞 并 接收 呼叫 。 

* ROBA 

在 这 个 例子 中 ,你 看 一 下 钟 ,然后 通过 电话 线 把 时 间 告 诉 对 方 。 

« HEW 

已 经 完成 了 对 该 呼叫 的 工作 , 挂 断 电话 。 

上 述 6 个 步 又 中 ,3 个 用 来 建立 服务 ,3 个 用 来 对 应 每 个 接 人 呼叫 。 这 6 个 步骤 就 是 对 在 
电话 网 上 送行 时 间 服 务 的 详细 描述 。 

2. 使 用 服务 

客户 端 如 何 使 用 上 所 提供 的 服务 呢 ? 每 个 客户 端 都 体 循 以 下 4 个 步 又 ， 

(1) 获取 一 根 电 活 线 

客户 端 同 样 需 要 一 个 授信 和 端点。 客户 问 还 要 从 电话 网 络 申 请 一 个 电话 号 码 ， 

(2) 连接 到 具 休 号 而 

宅 户 端 恒 用 这 根 电 族 向 电话 网 络 请 求 建立 一 个 到 特定 线路 的 连接 。 窜 广 端 拨打 大 
楼 的 电话 成 你 办 公 室 的 分 机 ,并 与 其 相连 。 其 中 的 商务 楼 的 号 码 和 分 机 号 码 的 组 合 被 称 
为 服务 的 网 络 地 址 。 从 技术 的 骨 皮 讲 , 商 务 楼 号 倘 是 主机 地 址 ,分 机 号 码 是 准 口 号 或 者 称 
为 端口 。 丰 前面 的 例子 中 ,主机 号 是 617- 一 999- 1234,2 O J 8080， 

(30 使 用 服务 

其 个 通信 端点 (窗户 端的 和 服务 器 端的 ) 现 在 已 经 建立 了 了 连接。 任何 一 方 可 以 通过 该 连 
接 向 另外 的 通信 端点 发 送 数 据 。 以 时 间 服 务 器 为 例 , 服 务 器 通过 线路 发 送 数据 ,而 客户 端 则 
接收 信息 。 像 目录 编排 这 样 更 加 复杂 的 服务 就 需要 服务 器 和 客户 映 之 问 更 复杂 的 交互 。 本 
书 在 后 面 将 分 析 更 复 荣 的 服务 。 

(40 FERTH T 

JH CAPE SE A. Volt np b EB RE. 

3， 重 要 概念 

BY IB) ARS eee I socket 编程 中 所 要 涉及 的 4 个 重要 的 概念 ， 

《1) 客户 和 服务 器 

已 经 不 止 一 次 地 讨论 该 问题 了 。 服 务 般 是 提 殿 服务 的 程序 。 在 Unix 中 ,服务 器 是 一 个 
程序 不 旦 一 台 计 算 机 。 了 服务 器 进程 等 待 请 求 , 处 理 请 求 , 然 后 循环 回去 等 待 下 一 个 请 求 。 客 
户 奖 进程 则 不 需要 循环 , 它 只 需 建 立 一 个 连接 ,与 服务 器 交换 数据 ,然后 继续 自己 的 工作 。 

(2) 主机 名 和 端口 

运行 于 因特网 上 的 服务 器 其 实 是 某 台 计算 机 上 运行 的 - -个 进程 。 这 里 计算 机 被 称 为 主 
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机 ， 机 器 通常 被 指定 一 个 名 字 如 sales. xyzcorp. com, 这 被 称 为 该 主机 的 名 字 。 服 务 器 下 该 
主机 上 拥有 一 个 端口 。 主 极 和 端口 的 组 合 才 标识 了 一 个 服务 器 。 

《3) 地 址 族 

你 的 时 间 服 务必 须 拥有 ~- 个 电话 号 码 , 它 还 可 能 有 街道 地 址 和 邮编 ,甚至 可 能 有 经 度 和 
纬度 或 是 其 他 集合 的 数据 等 属性 。 上述 每 个 集合 的 数据 都 是 你 的 服务 的 地 址 。 但 是 如 用 经 
度 和 纬度 来 代 兰 电话 号 码 中 的 电话 号 码 和 扩展 号 码 的 活 , 它 们 有 可 能 涉 能 正常 运作 ， 

上 面 的 每 个 地 址 分 别 属于 不 同 的 地 址 族 。 电 话 号 褒 和 分 机 号 码 是 电话 网 络 地 址 族 的 地 
址 ,这 里 可 以 用 AF PHONE 来 标识 。 类 似 地 ,经 度 和 纬度 在 全 球 坐 标 系统 地 址 族 中 才 有 意 
义 ; 并 可 以 用 AF. GLOBAL 来 标识 。 

(4) 协议 

协议 是 服务 器 和 客户 之 间 交 互 的 规则 。 在 时 间 服 务 器 的 例子 中 ,协议 很 简单 : 客户 了 
叫 ,服务 器 回答 ,给 出 时 间 信 息 后 排 断 。 

如 果 运 行 的 是 一 个 查 号 辅助 服务 ,又 将 如 和 何 呢 ? 协议 将 会 复杂 一 点 。 服 务 弟 需要 问 
答 和 发 送 初 始 欢迎 信息 (例如 :欢迎 访问 查 号 辅助 系统 ,请 问 您 在 哪个 城市 ??)。 客 户 端 
给 出 城市 的 名 字 后 ,服务 器 将 询问 所 查 名 字 ( 人 例如;:“ 您 需要 查询 什么 ?”)。 客 户 端 以 某 公 
司 或 个 人 的 名 字 作 应 管 。 这 时 服务 器 给 出 所 要 请 求 的 电话 号 码 或 此 城市 不 存在 所 查 词 的 
名 字 的 消息 。 一 些 查 号 辅助 服务 紫 还 提供 付费 的 电话 服务 ,消息 的 交互 这 循 查 号 辅助 内 
iX (directory ^ assistance protocoD ,本 章 称 其 为 DAP, 每 个 客户 /服务 占 模 型 都 必须 定义 这 
样 一 个 协议 。 


11.5.2 因特网 时 间 、DAP MAS HB 35 ze 


时 间 上 服务 器 和 查 号 辅助 服务 器 的 例子 不 仅仅 是 用 于 教学 的 比喻 ,它们 在 因特网 中 存在 
着 广泛 的 应 用 。 试 一 下 下 面 的 命令 : 


$ telnet nit, edu 15 

Trying 18. 7.21.69... 

Connected to mit. edu 

Escape character is '^!'. 

Mon Aug 13 22.36.44 2001 
Conncetion closed by [foreign host. 


$ 


位 于 MIT 的 某 台 主机 上 有 一 台 时 间 服 务 嚣 , 它 在 13 号 端口 等 待 请 求 。 当 用 telnet 和 该 
服务 器 连 苇 的 时 候 , 上 服务 朵 接收 请 求 , 检 查 系 统 时 钟 , 通 过 网 络 送 回 当前 的 时 间 , 然 后 挂 断 连 
接 。 忠 前 而 的 时 间 服 务 的 例子 完全 相同 ,它们 甚至 使 用 了 相 局 的 协议 。 试 .下 连接 到 其 他 
主机 的 13 See. AAG BUTE A bE A OL aE Lb OO aT ay 

telnet EF MR — Ei. “EC Ali ie ELH ox ER. ABR EN A 
SOC TR J EYE Be HS HEE SRL Sek BEBE c SU n9 CS dS BB 。 

那 查 妃 辅 助 服务 又 如 何 呢 ? 查 号 辅助 服务 器 通常 在 79 SRO. Pa. ea Re dn 


PETAS: 
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5 telnet princeton, edu 79 
Trying 128.112.128.981... 


Connected to princeton, edu. 


Escape character is '^|'. 


Smith 


name. 
department: 
email; 
emia il box: 


netid: 


name ; 
department: 
email. 
emailbox: 


netid., 


: 000012345 


Waldo Smith 

Special Student 

waldos(a@ Princeton. EDV 
waldos(eimail, Princeton. EDU 


waldos 


. 000333333 


Ignatz E Smith 
Undergraduate Class uf 1997 
ismith(&Princeton. EDU 
ismibth(é mail. Princeton. EDU 


ismith 
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4 — PAK SIME HRS dE RAK. PILE TE P bI A AP 8 EVA I] E 
fü. HER B PUE PC BE A fe IRE ERI HEBR. 
A^ RSS MEE RYE? 试 一 试 下 面 的 命令 : 


telnet rainmaker.wunderground.com 3000 
该 天 气 服务 的 协议 更 加 复杂 ,不 过 界 商 却 友好 得 多 。 
11.5.3 服务 列表 : 众所周知 的 端口 


刀 何 知道 端口 13 at EARS m On 79 A RAIS? 同样 的 道理 ,在 美国 每 个 人 
都 知道 号 码 911 是 紧急 服务 ,号 码 411 是 查 号 服务 ,这些 就 是 你 所 周知 的 端口 。 在 文件 ete 
services 中 定义 了 众所周知 服务 端口 号 的 列表 : 


S more /etc/services 

+t S NetBSD, services, v 1.18 1996/03/26 00.07,58 mrg Exp $ 
i Network services, Internet style 

4 

# Note that it is presently the policy of LANA to assign a single 

# well - known port number for both TCP and UDP;hence, most entries 
it here have two entries even if the protocol doesn’t support UDP 


f operations. 
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# Updateed from RPC 1340, "Assigned Numbers"(July 1992). Not al! 


it ports are included, only the more common ones. 


B 
+ From; ta # services 5.8 (Berkeley) 5/9/91 
# 

tcpmux 1/tep #TCP port service multiplexer 

echo Ty tep 

echo 7 /udp 

discard . 9/tcp sink null 

discard 9/udp sink null 

systat il/tep users 


datetime 13/tep 
datetime  13/udp 
-— more -— (1358) 


SAN BOTA ERBIA Fee 13. (TR BIAEYAOX UE RI UE SAHN EUL AiE 
服务 ,如 ftp. telnet.finger 和 http 的 端口 。 

所 有 这 些 运 行 在 因特网 主机 上 的 服务 实际 上 都 是 基于 前 面 给 出 的 时 间 服 务 器 模型 的 思 
想 和 步骤 的 。 这 里 和 将 把 这 些 思想 应 用 于 Unix 的 系统 调用 ,从 而 编写 自己 的 导 间 服务 器 以 及 
TE PU hit AE 


11.5.4 编写 timeserv. c: 时 间 服 务 器 


上 面 提 到 的 基于 电话 的 时 间 骤 务 诗 及 6 THR. TARSAR RIAM. XJ 
应 关系 如 下 所 示 : 





行 为 系统 调用 

l. 获取 电话 线 mE socket 

2. WSS hind 

3, IFEA RA listen 

4, St ER FB T accepi 

5, 传送 数据 read/write 
6. HE EH i close 

程序 如 下 ; 


/* timeserv.c a socket - based time of day server 


w g 


Ë include < stdio. hi> 
i include <Uunistd. h> 
# include <(sys,types. h> 


i jnclude «sys socket. hi> 
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H include -netinet/in.h- 
H include «netdb. h> 


# include time. h= 


# include << (strings. h > 


# define PORTNUM 13000  /* our time service phone number +/ 


4+ define  HOSTLEN 256 


H define oops(msg) 1 perror(mag) ; exit(l1) ; } 


int main(int ac, char x av J) 


i 


struct  sockaddr in sadar ; /* build our address here */ 
struct hostent * hp; /x this is part of our «/ 


char hostname| HOSTLEN ; 


4 


/x address x; 


int sock id,sock fd; /* line id, file dese «/ 
FILE * sock fp; /* use socket as sl ream «/ 
char * ckimet) ; /* convert secs to string x/ 
time t thetime; /* the time we report x/ 

ix 


x Step 1; ask kernel for a socket 


xf 
sock id = socket( PF INET, SOCK STREAM, 0 ); /* get a socket x 
if ( sock id == 一 1 ) 
oops( "socket" }; 
fs 


* Step 2; bind address to socket. Address is host,port 


x f 
bzero( (void * }&saddr, sizeof(saddr) ); /* clear out struct x/ 
gethostname( hostname, HOSILEN } ; /* where am I ? x/ 
hp = gethostbyname( hostname ); /* get info about host «/ 


¿x fill in host part */ 
bcopy( (void * ?)hp- —h addr, (void s )&saddr.sin addr, 
hp- z-h length); 


saddr. sin port = htons(iPORTNUM); /* fill in socket port x/ 
saddr.sin family = AF, INET ; /* fill in addr family x/ 
if ( bind(sock id, (struct sockaddr x )&saddr, sizeof(saddr)) |= 0) 


oops( "bind" >; 


, 


PX 


* Step 3: allow incoming calls with Qsize- 1 on socket 


+ 343 * 
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x / 
if ( listen(sock id, 1) !- 03 
oops( "listen" »; 
i* 


* main loop, accept), write(3, closel] 


x / 
while ( 1 }{ 
Sock fd = accept(sock id, NULL, NULL); 
printf( "Wow! got a call! Xn'); 
if ( sock fd == -1) 
oops( "accept" »; 
sock fp = fdopen(sock fd,"w"); 
if ( sock fp == NULL ) 
oops( "fdopen" ); 
thetime = time( NULL}; 
fprintf( sock fp, "The time here is .." 5»; 
fprintf( sock fp, "* s", ctime(Sthetime) }; 
fclose( sock fp); 
i 


F 面 将 对 程序 如 何 工 作 给 出 解释 。 
* AE 1. MAH IBS T socket 


socket 是 一 个 通信 和 端点。 就 像 位 于 墙 上 的 电话 岳 座 一样 ,socket 是 产生 呼叫 和 接收 呼叫 


的 地 方 。 系 统 调 用 socket 创建 一 个 socket, 





目标 yf socket 
z i t include < sys/types, ho 
H include —sys/socket. hi> 
函数 原型 sockid = sockett(int domain,int typesint protocol) 
参数 dornain JE fr; be 
PF INET 用 于 Internet socket 
Ly pe socket MEA, SOCK STREAM #2 3B 35 iy 
protocol Hpi socket 中 所 用 的 协议 .默认 为 日 
返回 慎 = 遇 到 错误 | 
sockid mi, x iis. [n] 





socket 


x 


wait for call x/ 


error getting calls */ 


we'll write to the x/ 


socket as à stream #; 


‘x unless we can't */ 


get time x/ 


and convert to strng x/ 


release connection «/ 


—— ae. ħħ 
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socket 油 用 创建 一 个 通信 端点 并 返回 一 个 标识 符 。 有 很 多 种 类 型 的 通信 系统 ,每 个 被 称 
为 一 个 通信 域 。Internet 本 身 就 是 一 个 域 。 在 后 面 会 看 到 Unix 内 核 是 另 一 个 域 。Linux x 
持 好 几 个 其 他 域 的 通信 ， 

socket 的 类 型 指出 了 程序 将 要 使 用 的 数据 流 类 型 。 SOCK_STRAEAM 类 型 跟 双 向 的 
管道 上 类似。 数据 作为 连续 的 字 节 流 从 一 端 写 人 ,再 从 另 一 端 读 出 。 后 面 的 章节 中 将 介绍 
SOCK DGRAM 类 型 。 

函数 中 最 后 的 参数 protocol 指 的 是 内 核 中 网 络 代 人 码 所 使 用 的 协议 ,并 不 是 客户 问 和 服务 
器 之 间 的 协议 。 一 个 为 0 的 值 代表 选择 标准 的 协议 。 

* 步骤 2: Sh MEHL socket 上 ,地 址 包括 主机 .端口 

下 一 个 步 权 是 把 一 个 阿 络 地 址 分 配给 socket, TE Internet 域 中 ,地 址 由 主机 和 和 端口 构 
成 。 这 里 不 能 使 用 端口 13 ,因为 该 端口 已 经 为 时 间 服 务 器 保留 .这 里 可 使 用 端口 13000 
来 代替 。 可 以 为 你 的 服务 器 端口 选择 任意 的 号 三, 只 是 该 导 友 不 要 太 小 苹 丰 能 已 经 被 占 
A. EROS UT REC AR RS A ARERR PEA. RRR RO 
口 的 限制 范围 。 端 口号 是 一 个 16 位 的 数值 ,所 以 有 很 多 端口 号 可 用 。 系 统 调 用 bind 如 下 
FR. 


bind 
= $5 绑 定 一 个 地 址 到 socket 
KM d include <sys/types. h> 
# include sys socket, h> 
BE f a BY result— bind(int sockid, struct sockaddr * addrp. socklen t addrlen) 
参数 sockid socket 的 id 


addrp 指向 包含 地 址 结构 的 指针 
addrlen — Aa bk BE 


BE a 18 Bl FRR 
0 成 功 


bind 调用 把 一 个 地 址 分 配给 socket。 该 地 址 的 分 配 就 类 似 于 把 一 个 电话 号 局 分 配给 墙 
上 的 一 个 插座 ; 当 进 程 要 与 服务 器 连接 的 时 候 , 它 们 就 使 用 该 地 址 。 每 个 地 址 族 都 有 自己 的 
格式 。 因 特 网 地 址 族 (AF_INET) 使 用 主机 和 端口 来 标志 。 地 址 就 是 一 个 以 主机 和 端口 为 成 
员 的 结构 体 。 自 己 写 的 程序 应 首先 初始 化 该 结构 的 成 员 , 然 后 青 填 充 其 体 的 主机 地 址 和 疹 
口号 ,最 后 填充 地 址 族 。 关 于 建立 上 述 数据 的 县 体 困 数 ,可 参阅 帮助 手册 。 

当 所 有 的 部 分 被 填充 了 之 后 ,地 址 已 经 被 绑 定 到 该 socket E. 其 他 类 型 的 socket 会 使 
用 包含 不 同 成 员 的 地 址 。 

e 步骤 3: 在 socket 上 ,人 允许 接 人 了 呼叫 并 设置 队列 长 度 为 1 

服务 器 接收 接 入 的 呼叫 ,所 以 这 时 的 程序 必须 使 用 listen. 
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listen 

目标 监听 socket 上 的 连接 
3k x dt z include «sys/socker. hi> 
函数 原型 | result listen(int sockid.int qsize? 
参数 sockid ji WE Te ok AY socket 

quize TITRA HRA H 
返回 信 =d B Ee ux 

0 成 功 


listen 请 求 内 核 允 许 指定 的 socket 接收 接 信 呼叫。 并 不 是 所 用 类 型 的 socket 都 能 接收 
接 人 上 呼叫。 但 SOCK STREAM 类 型 是 可 以 的 。 第 二 个 参数 指出 接收 队列 的 长 度 。 在 本 章 
的 程序 中 请 求 的 是 一 个 长 度 为 1 KAAL AF RAKERA FRK socket HRM. 

© IER 4. 等 待 /接收 呼叫 

— E socket 被 奸 立 并 被 分 配 一 个 地 址 ,而 且 淮 备 等 待 接收 呼叫 ,程序 即将 井 始 工作 ， 役 
务 器 等 待 直 到 呼叫 到 来 。 它 使 用 系统 调用 accept 来 接收 调用 ， 


accept 
目标 接收 socket 上 的 … 个 连接 
文件 MEME 3binchude «sys types. h> E 
# include < sys sockel, h> 
函数 原型 fd — accepitint "INED METET x callerid, socklen_t > addrlenp) 
参数 sockid 接收 该 socket 上 的 呼叫 


callerid 18 m] mE WY 3 He hb s TA AY FE Et 
返回 但 l iB Fl a x: 
fd HH TuEEIRBR x fEEIET 


accept 阻 寨 当 前 进程 ,一 直到 指定 socket E BS E A iE TE se vro EAR accept 将 返回 
X EIER : HARAXE E ETT RS PRE. MOX f RF Ss LEE A tw 
某 个 文件 描述 符 的 一 个 连接 ， 

accept 交 持 一 种 类 型 的 呼叫 者 的 ID。 在 呼叫 发 起 者 一 边 ,socket 有 自己 的 地 址 ,例如 对 
于 因特网 连接 ,地 址 就 是 主机 地 址 和 端口 号 。 如 果 callerid 和 addrlenp 指针 不 为 空 的 话 , 内 
核 将 把 呼叫 者 地 址 填充 到 callerid 所 指向 的 结构 中 ,并 把 该 结构 的 长 度 填充 到 addrlenp 所 指 
个 的 内 存单 元 中 ， 

就 像 人 们 使 用 来 电 显示 的 信息 米 决定 如 何 姓 理 打 入 的 电话 一 样 ,一 个 网 络 程 序 丰 以 使 
用 呼叫 进程 的 地 址 米 决 定 如 何 处 理 该 连接 ， 

。 HERS: 传输 数据 

accept 调用 所 退回 的 文件 撒 述 符 是 一 个 普通 文件 的 撒 述 符 。 对 它 的 操作 从 第 2 mnm 
习 完 open 调用 之 后 一 自在 使 用 。 程 序 timesery. c 用 [dopen 将 文件 描述 符 定向 到 缓存 的 数 
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据 流 ,以 便于 使 用 fprint[ MARETA. ELAR REE AR write 来 完成 这 项 工作 。 


accept 所 返回 的 文件 描述 答 可 以 由 标准 的 系统 润 用 close XAL SSE EK T X 


端的 socket; 行 另 一 端的 进程 得 试图 读数 据 的 话 , 它 将 得 到 文件 结束 标记 。 
it FE ALL. 


11.5.5 测试 timeserv. c 
下 面 叮 以 编译 并 运行 时 间 服 务 器 : 


$ cc timeserv.c - o Lineserv 
$5 timeserv& 

29352 

$ 


启动 服务 以 “各” 符 时 结尾 ;所 以 shell 将 运行 它 但 不 调用 wat 调用 
accept WH F.a X Hal V/A] telnet 连接 到 服务 器 上 | 上， 


S telnet 'hostname' 13000 

Trying 123.123.123.123 

Connected to somesite. net 

Escape character is '^ ', 

Wow! got a call! 

The time here is ., Tuc Aug 14 11,36,.30 2001 
Connection close by foreign host. 

3 

S telnet 'hostname' 13000 

Trying 123.123. 123. 123 

Connected to somesite. net 

Escape character ig '^ ' 

Wow! got a call! | 

The time here is .. Tue Aug 14 11.36.53 2001 
Connection close by foreign host. 


S 


ix ER A 89 T fF 


. HR 5 RE RA ATE 


Lf TÉFPIEGLT ANER, HALRA a T WIESE. RS iz tr. ae 


H kill fg T RAG RAS i. 


S kill 29362 


对 于 此 服务 器 而 译 'telnet 程序 是 其 客户 . 但 它 并 不 总 是 适合 连接 到 任何 服务 器 上 的 。 


这 里 将 针对 该 服务 只 编 写 一 个 特殊 的 客户 端 程序 。 
11.5.6 编写 timeclnt.c: 时 间 服 务 客户 端 


基于 电话 的 时 间 服 务 客户 端的 实现 包含 4 个 步骤 ,每 个 步骤 对 应 于 一 个 系统 调用 ， 


ST | » ^ mo — íÀ Go s X — € — — ÓÀ —] + 
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行 为 系统 调用 
B i 获取 一 根 电话 线 socket 
2. HE UY ARS 38 connect 
3. 传送 数据 read/write 
4, FER HE i close 





FART: 


/* timeclnt.c - aclient for timeserv.c 
x usage, timeclnt hostname portnumber 


* Li 


i include  -—stdio.h- 

| dinclude  «sys/types.h- 
# include  -—sys/socket.h-— 
# include <(netinet/in. h> 


# include  «inetdb.h-— 
# define oopsímsg) i perror(msq); exit(1); 3 


main(int ac, char * av[ |} 


1 


struct sockaddr in servadd; /* the number to call «/ 
struct hostent * hp; /* used to get number xy 
int | sock id, sock fd; /* the socket and fd x/ 

char  message|BUFSIZ]: /* to receive message x/ 
int messlen; /* for message length xy 


im 
* Step 1. Get a socket 


x/ 


sack id = socket( AF INET, SOCK STREAM, 0}; /* get a line x/ 
if ( sock id == -]) 


oops( "socket" ); /* or fail x/ 


ix 
x Step 2: connect to server 
* need to build address (host,port) of server first 


xf 
bzero( &servadd, sizeof( servadd ) 2; /x zero the address x, 


hp = gethostbyname( av[1] ) ， /* lookup hosts ip 4 */ 
if (hp == NULL) 


copstiav| 1]5; /* or die x/ 


boopy(hp - —h addr, (struct sockaddr * )&servadd. sin addr, 
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hp- =h length}, 
servadd.sin port = htons(atoi(av| 2.)); /* fill in port number */ 


servadd. sin family = AF INET ; /* fill in socket type */ 
/* now dial */ 
if ( connect(sock id,(struct sockaddr * }&servadd, 
sizeof(servadd)) | - 0} 


ti 
oons( "connect" ); 
À 


i * 


* Step 3. transfer data from server, then hangup 


* / 
messlen = read(sock id, message, BUFSTZ); /* read stuff a; 
if ( messlen == 1? 


oops("read") ; 
if ( write( 1, message, messien ) |= messlen ) /* and write to s/ 
popsi "write" }; /* stdout x/ 
close( sock id j; 
J 
下 商 是 对 访 程 序 的 解释 ， 
+ WAR 1: EAH eR EVE socket 
客户 端 需要 一 个 socket 跟 网 络 和 相连 UL BT TA AR 9 1P 169 2p oe i 2e a ARH Ts 
网 络 相连 一 样 。 客 户 端 必须 建立 Internet 城 (AF_INET)}socket, 并 且 它 还 必须 是 流 socket 
(SOCK STREAMD, 
。 步 又 2: 与 服务 器 相连 
客户 端 需要 连接 到 时 间 服 务 器 。connect 系统 调用 的 作用 实际 上 与 打 电 话 类 似 、 


connect 





”目标 连接 到 socket 
KM # include «sys/types. h> 
+ include -<sys/socket, ho. 





函数 原型 result — connectCint sockid, struct sockaddr * scrv_addrp, socklen_t addrien) - 
参数 sockid 用 证 建 立 连 接 的 socket 
serv addrp {EPRA ai HE Prada e 
addrlen fats aeu 
返回 值 =l IR 
GO 成 功 





connect Hel FAG PATE B sockid 所 标识 的 socket 和 由 serv. addrp 所 指 问 的 socket Jh d 38 
连接 。 如 果 连 接 成 功 的 证 ,conmnect 返回 0。 而 此 时 ,sockid 是 一 个 侣 法 的 文件 措 述 符 , 可 以 
用 来 进行 读 写 操作 。 写 人 该 文件 描述 符 的 数据 被 发 送 到 连接 的 另 一 端的 socket, MMS — AG 
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写 人 的 数据 将 从 该 文件 描述 符 读 取 。 

« 步骤 3 和 4: 传送 数据 和 挂 断 

在 成 功 连 接 之 后 ,进程 可 以 从 该 文件 描述 符 读 写 数据 ,就 像 与 普通 的 文件 或 管道 相连 接 
一 样 。 在 时 间 服 务 的 客户 /服务 器 例子 中 ,+jimeclnr 只 是 从 服务 器 读 了 到 一 行 数据 。 

该 取 时 间 之 后 ,客户 端 关闭 文件 描述 符 然 后 退出 。 若 客户 端 退 出 而 不 关 财 描述 符 , 内 以 
将 完成 关闭 文件 描述 符 的 任务 。 


11.5.7 测试 timecinf. c 


大 家 已 经 有 好 几 页 设 有 看 到 插图 了 .大 概 已 经 忘记 这 些 代 码 的 任务 了 吧 。 图 11.9 将 
会 提醒 我 们 。 服 务 器 进程 运行 在 一 台 机 器 上 ,而 客户 端 程 序 在 另 一 台 机 器 上 通过 网 络 与 
服务 器 连接 。 服 务 占 通过 write 调用 来 发 送 数据 ,客户 端 通过 read 调用 来 接收 消息 。 
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图 119 位 于 不 同 机 器 上 的 进程 


对 上面 这 有 段 代码 真实 的 测试 需要 在 不 同 机 器 上 运行 这 两 个 程序 .我 不 太 确 定 下 面 写 在 
书 上 的 测试 情况 是 否 足 够 明确 ,不 过 大 家 可 以 作为 参考 : 


$ hostname # xn ELSE 
computer]l.mysite.net 并 第 一 台 机 点 

S Cc timeserv.c - o timeserv HR RAH 

s ./timeserv E # 并 运行 它 

[1] 10739 

$ 

S scp timeclnt,c bruce(Zcomputer2, 托 发 送 客 户 代 码 到 另 一 台 机 器 
bruce@computer2’s password, 

timeclnt.c | KB | 1.8KB/s IETA; 00,00,00 [100 & 


S ssh brnce(@conputer2 

bruce@computer2’s password. 

No mail. 

computer2-bruces cc timeclnt.c - o timeclnt 

computer2; bruce $./timeclnt computer? 13000 Wow) Got a call! 
The time here is , ,Tue Aug 14 02.44.31 2001 


computer? ;bruces 
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服务 器 编译 好 后 ,运行 在 机 器 | 上 。 然 后 把 客户 端 程序 复制 到 机 器 2 E. Bx es 
2。 在 机 器 2 上 ,编译 好 客户 端 后 ,然后 让 客户 端 请 求 与 运行 在 机 器 上 1 上 监听 在 13 000 ta H 
的 服务 器 相连 接 。 这 里 看 到 的 消息 就 是 从 机 器 1 上 的 服务 器 通过 网 络 发 送 给 机 器 2 上 的 客 
户 的 。 而 客户 再 把 消息 发 送 至 标准 输出 .。 

从 上 面 的 测试 结果 是 否 能 真 的 看 到 机 器 2 上 的 输出 ”我 是 从 机 器 1 连接 到 机 器 2 的 .所 
以 显示 消息 的 终端 实际 上 是 连接 到 机 器 ) 上 的 、 后 面 的 一 些 练习 会 让 你 仔细 考虑 其 运作 
原理 。 

通过 umeserv/timeclnt 程序 ,可 以 得 到 另 一 台 机 器 上 的 时 间 。 检查 另 一 台 机 化 上 的 时 
间 可 以 保证 不 同 机 器 的 时 钟 同步 。 网 络 上 的 某 台 机 器 可 以 作为 权威 时 间 服 务 器 ,而 其 他 的 
机 器 可 以 利用 上 面 的 程序 周期 性 地 来 调整 自己 的 时 钟 。 


11.5.8 另 一 种 服务 器 : 远程 的 Is 


下 一 个 项 目 是 编写 一 个 可 以 打印 远 端 机 器 上 文件 列表 的 程序 。 你 可 能 在 两 台 机 器 上 杉 
有 了 账号, 蘑 想 看 另 一 台 机 器 上 的 文件 列表 时 如 何 去 做 呢 ? 可 以 登录 到 另 一 台 机 器 上 .然后 
运行 ls。 一 个 快速 的 且 更 加 方便 的 途径 是 运行 一 个 远程 的 1s 程序 ,这 里 称 它 为 rls(remore 
Is)。 可 以 指定 主机 名 各 目录 : 


S cls computer2. site. net /hoee/ne/code 


当然 ,rls 需要 在 另 一 台 机 器 上 的 一 个 服务 进程 接收 请 求 , 处 理 请 求 和 返回 结果 。 该 系统 
看 上 去 类 似 于 图 11. 10。 服 务 咒 运行 在 一 台 机 占 上 .客户 运行 在 另 一 合 机 器 上 并 与 服务 器 连 
接 , 把 目录 的 名 字 发 送 给 服务 器 。 服 务 器 将 位 于 该 且 录 下 的 文件 列表 信息 返回 给 客户 端 . 
客户 端 将 结果 送 至 标准 和 输出 把 它们 显示 出 来 . 两 进 竹 系 统 旭 供 了 对 于 不 同 机 器 上 的 目录 访 
问 的 支持 。 
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图 11.10 一 个 逗 端 的 ls 系统 


)， 设 计 远 程 ls 系统 

这 里 需要 3 个 要 素来 实现 rls 系统 : 
(1) 协议 

(2) & PS ER JT 

(2) 服务 器 端 程序 
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2. Y 
HAS ARRAS. PH PMR TAS ARAMARK. RA aie 
该 目录 名 之 后 打开 并 读 取 该 目录 ,然后 把 文 作 列 表 发 送 到 客户 端 。 客 户 端 循环 地 读 到 文件 
5j . EC MCA d HEU E FE Eo PES Ros. 
3. BP SER. rs 


/* rls. — a client for a remote directory listing service 
* usage. rls hostname directory 
x / 
H include <stdio.h> 
4 include — «sys/types. h> 
d include — «sys/socket. h^ 
€ include CC —netinset/in,hl- 
| } include -~ netdb. h 


# define ^ oops(msq) | perror(msg); exit(12; | 
# define PORTNUM 15000 


main(int ac, char * aví .) 


i 


struct sockaddr in servadd; /* the number to call «/ 
struct hostent * hp; /* used to get number x/ 
int sock_id, sock fd; /* the socket and fd «/ 

char buffer[BUFSIZ ; /* to receive message +/ 
int | n read; /* for message length «/ 


if (ac f= 3) exit(15; 


/** Step1, Get a socket * «/ 


sock_id = socket( AF INET, SOCK STREAM, 0 }; /* get a line «/ 
if ( sock id == -1) 
oops( "socket" j. fx or fail */ 


‘x * Step 2; connect Lo server x x/ 


bzero( &servadd, sizeof(servadd) ) ， /* zero the address +, 


F 


hp = gethostbyname( av[1]); /* lookup host’s ip #  s/ 
if (hp == NULL) 

oopstav| 1 ])， /* or die x/ 
bcopyChp - —h addr, (struct sockaddr * j&servadd.sin addr, hp- >h length); 
servadd.sin port = htons(PORTNUM) - /* fill in port number «/ 
servadd. sin family = AF INET ; /* fill in socket type x/ 
if ( connect(sock id,(struct sockaddr + J&servadd, sizeof(servadd)) | = 0) 


oops( "connect" }: 


/* * Step 3; send directory name, then read back results x «/ 
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if C write(sock id, av[2], strlentav[2])) == -1) 
oops("write"); 
if ( write(sock id, "\n", 1) == -1) 


cops( write"); 
while( (n read = read(sock, id, buffer, BUFSIZ)) > 0) 
if ( write(), buffer, n read) == -1) 
oops( "write"); 
close( sock id ); 


} 


注意 该 客户 端 与 时 间 服 务 客户 端的 不 同 之 处 。rls 客户 端 首先 把 目录 名 写 到 socket f, 
上 面 的 内 议 规定 了 管 户 端 每 次 发 送 一 行 , 因 此 程序 中 在 行 尾 增加 一 个 换行 符 。 接 下 来 ,客户 
端 进 人 一 个 循环 ,将 从 socket 所 接收 的 数据 复制 到 标准 输出 .直到 接收 到 文件 结尾 标志 。 
ris. c 使 用 低级 别 的 write 和 read 调用 来 和 服务 器 交换 数据 。 循 环 中 用 到 了 标准 大 小 的 缓存 
以 提高 效率 。 下 面 将 编写 服务 器 端的 程序 。 

4. IS EAE. rlsd 

服务 器 必须 得 到 一 个 socket, 然后 调用 bind, listen 命令 ,最 后 调用 accept fili K 
叫 。 在 接收 呼叫 之 后 ,服务 器 从 socket 读 取 目录 名 ,然后 列 出 该 自 录 下 的 内 容 。 服 务 器 是 如 
何 给 出 文件 列表 的 呢 ? 这 里 可 以 把 第 3 章 写 的 ls 程序 复制 过 来 ,但 也 可 以 用 一 个 更 简单 的 
方法 : 仅仅 使 用 popen 读 取 常规 版 本 的 js 程序 的 输出 ,如 图 11. 11 所 示 。 


客户 IR Fy AA 








S a, 
we : EPET EU E ae iru s | F P^ un rok 


sk "|s" 
X 
ls fü tH 





图 11.1]. 使 用 popen"|s "3% fg on ze m El SK 
下 面 的 代 砂 中 使 用 了 popen: 


/* rlsd.c — a remote ls server - with paranoia 
¥/ 

# include <stdio. h> 

H include <unistd.h> 

H include <sys/types. h> 

H include <sys/socket. h> 

# include  «netinet/in. h> 


354 。 


并 include  -—netdb.h- 
include «time. h» 


# include «strings. h» 


# define  PORTNUM 15000 
4 define  HOSTLEN 256 
# define  oops(msg) 
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/* our remote ls server port */ 


| perror(msg) ; exit(1) ; } 


int main(int ac, char * av| D 


i 
struct  sockaddr in 


struct  hostent 


char hostname| HOSTLEN |: 


saddr, /* build our address here x/ 


* hp; 


int Sock id,sock fd; 


r 


/* this is part of our x/ 
/* address #/ 


/* line id, file desc x/ 


FILE x sock fpi, x sock fpo; /* streams for in and out x/ 


FILE * pipe fp; 


char dirname! BUFSIZ | ， 
char command[ BUFSIZ] ; 


int dirlen, c; 


/* use popen to run 1s «/ 
/* from client */ 


pi 


/* for popen() «/ 


/** Step 1, ask kernel for a socket * x/ 


sock id = socket( PF INET, SOCK STREAM, 0); /* get a socket x/ 
if ( sock id == -13 


oops( "socket" ) ; 


/** Step 2, bind address to socket. Address is host port + x/ 


bzero( (void « )&saddr, sizeof(saddr) ); 


/* clear out struct «/ 


gethostname( hastname, HOSTLEN }; /* where am I ? */ 


hp = gethostbyname( hostname ): 


/* get info about host +/ 


bcopy( (void *)hp- >h addr, (void * )&saddr.sin addr, hp- 7h length); 


saddr, sin port = htons(PORTNUM); 
saddr.sin family = AF INET ; 


/* fill in socket port x/ 
/* fill in addr family x/ 


if ( bind(sock id, (struct sockaddr + )&saddr, sizeof(saddr)) I= 0) 


cops( "bind" ): 


/* * Step 3, allow incoming calls with Qsize = 1 on socket x x/ 


if ( listentsock id, 1) !- 0) 


oops( "listen" )- 


7 x 


* main loop: accept(), write(), clase) 


f 


* z 


while ¢ 1 }{ 


Sock fd = accept(sock id, NULL, NULL); /* wait for call «/ 


if ( sock fd == 


—1 3j 
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ocops("accept") ; 
/* open reading direction as buffered stream */ 
if( (sock fpi = fdopen(sock fd, "r")) == NULL ) 


oops "fdopen reading"); 


if í fgetstdirname, BUFSIZ-5, sock fpi) == NULL ) 
oops( "reading dirname"? ; 


sanitize(dirname); 


/* open writing direction as buffered stream x/ 
if ( (sock fpo = fdopen(sock fd,"w")) == NULL) 


oopst"fdopen writing"): 


sprintfícommand,"ls $s", dirname); 
if ( (pipe fp = popen(command, "r")) == NULL > 


oops("popen"); 


/* transfer data from ls to socket */ 
while( (c = getc(pipe fp)) 1= EOF } 
putc(c, sock fpo); 
pcloset(pipe fp); 
fclose(sock fpo); 
fclosetsock fpi); 


| 


sanitize(char * str} 
fm 
* it would be very bad if someone passed us an dirname ] ike 


* "s: rn * “and we naively created a command “ls ; rm x " 
* 
* SO..we remove everything but slashes and alphanumerics 


x There are nicer solutions, see exercises 


*/ 


char * sre, «x dest; 


for ( src = dest = str; * src ; srett 3} 


if ( sre == '/']|j isalnum( + sre) ) 
x dest tt = * sre; 
x dest = 'XO'. 


注意 服务 器 程序 使 用 标准 缓存 流 来 读 写 数据 。 服 务 器 用 fgets 调用 从 客户 端 读 取 目 录 
名 。 在 调用 popen 后 ,服务 髓 就 像 复制 文件 一 样 地 使 用 getc 和 pute 来 传输 数据 。 当 然 ,服务 
器 实际 上 基 从 本 机 上 的 进程 向 另 一 台 机 器 上 的 进程 复制 数据 。 
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注意 sanitize 汕 数 的 使 用 。 对 丁 任何 运行 参数 中 所 含 的 命令 或 从 因特网 上 效 取 数据 的 
服务 器 ,在 编写 的 时 候 都 要 格外 小 心 。 程 序 中 的 服务 器 等 待 接收 来 自 客户 端的 目录 名 ,然后 
把 它 追 加 到 ls 命令 的 尾部 。 例 如 ,如 果 客 户 端 发 送 字 符 申 /bin” ,服务 器 将 创建 并 运行 “1s / 
bin" 命 邻 。 这 是 正确 无 误 的 。 但 是 ,如 果 有 人 发 送 字符 串 “; rm * ”给 服务 器 ,服务 器 将 创建 
并 运行 “ls ; rm * "aS f. 

为 了 减少 被 破坏 的 风险 ,程序 中 必须 确保 接收 的 字符 串 没 有 溢出 输入 缓存 ;也 没有 游 出 
给 命令 设置 的 缓存 并 且 接 收 的 和 且 录 名 中 不 允许 出 现 非法 字符 。popen 系统 调用 对 于 编写 网 
络 服务 来 说 是 很 危险 的 ,因为 它 直 接 把 一 行 字符 串 传 给 shell。 在 网 络 程序 中 ,将 字符 串 传 给 
shell 是 一 个 非常 错误 的 想法 。 举 这 个 例子 的 目的 有 两 个 : 首先 ,展现 popen 的 妨 一 种 用 法 ; 
其 次 则 是 警告 大 家 其 危险 性 。 在 使 用 的 时 候 务 必 小 心 ! 


11.6 软件 精灵 


像 很 多 Unix 程序 一 样 ,Unix 服务 器 程序 有 短小 .简洁 的 名 字 。 很 多 服务 器 程序 都 是 以 
d 结尾 ,如 httpd, inetd, syslogd 和 atd。 这 里 的 d 表 示 精 灵 (daemon) H È E., WR m ag H 
syslogd 的 服务 器 程序 实际 上 是 系统 日 志 精 灵 (system log daemon)。 精 灵 就 是 一 个 为 他 人 
提供 服务 的 帮助 者 , 它 随 时 等 待 去 帮助 别人 。 在 你 的 系统 中 ,输入 命令 ps -el 或 ps -ax 就 
可 以 看 和 以 字符 d 结尾 的 进程 。 然 后 ,可 以 去 阅读 这 些 命 令 的 帮助 信息 ,从 市 可 以 更 加 深入 
地 理解 Unix 中 用 客户 /服务 器 模型 是 如 何 来 处 理 …… 些 基础 操作 的 。 

大 部 分 精 有 过 进程 都 是 在 系统 局 动 后 就 处 于 运行 状态 了 。 位 于 类 似 于 /etcyrc. d? 目录 中 
的 shell 脚本 在 后 全 启动 了 这 些 服务 ,它们 的 运行 与 终端 相 分 离 ,时 刻 准 备 提 供 数 据 或 服务 。 


小 


1]， 主 要 内 容 

。 一 些 程序 鹤 作 为 单独 的 进程 建立 起 来 来 接收 和 发 送 数据 ， 在 客户 /服务 器 模型 中 ,最 
务 器 进程 为 客户 进程 提供 处 理 或 数据 服务 。 

客户 /服务 器 系统 包含 通信 系统 和 协议 。 客 户 和 服务 器 通过 管道 或 socket 进行 通信 
协议 是 会 话 过 程 中 一 系列 规则 的 集合 。 

popen HE e& n] L RIEM shell 程序 咀 入 服务 器 程序 并 且 让 对 服务 器 的 访问 就 像 访 
问 缓 存 文件 一 样 。 

管道 是 一 对 相连 接 的 文件 描述 符 。socket 是 一 个 未 连接 的 通信 端点 ,也 是 一 个 潜在 
的 文件 描述 符 。 客 户 进程 通过 把 自己 的 socket 和 服务 器 端的 socket 相连 来 创建 一 
个 通信 连接 ， 

sockets ZAM ERAT RAGE. BH socket 以 机 器 地 址 和 端口 来 
PRH. 


ere 
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© BIS RI socket Bj fe FOL (ETE ETE. MIRA ARBRE SA a 
其 他 的 进程 通信 的 统一 编程 接口 ， 
2. 下 一 步 的 工作 


本 章 学 


习 了 客户 /服务 器 模型 编程 的 设计 和 两 种 连接 进程 的 方法 : 管道 和 socke, Æ F 


一 章 中 ;将 集中 精力 学 习 客 户 / 服 务 器 模型 编程 的 设计 原理 ,并 编写 更 加 复杂 的 程序 。 特 别 
地 ,下 一 章 将 把 对 socket 编程 和 文件 系统 及 进程 控制 的 知识 相 结合 来 编写 一 个 Web 服务 器 


3. 习题 


11. 1 


11.4 


11.5 


如 果 你 经 营 的 是 一 家 比萨 饼 外 卖 店 而 不 是 时 和 间或 查 号 辅助 服务 的 话 , 结 朵 将 如 
fj? 协议 将 更 加 复 条 。 为 送 外 卖 服务 描述 在 服务 器 和 客户 之 间 传 送 的 消息 序 
列 。 注 意 该 协议 包含 有 一 个 怎 环 ,以 便 允 许 客 户 增加 定购 项 。 


本 章 中 的 popen 版 本 没有 对 信和 号 做 任何 处 理 , 这 荐 不 是 正确 ? 子 进程 从 父 进程 那 
里 继承 了 信和 导 处 理 的 设置 。 在 考虑 以 下 三 和 神情 况 如 何 对 父 进 程 信 息 进 行 处 理 之 
后 ,回答 该 问题 : Ai SRV RRR. 


在 时 间 服 务 咒 和 客户 端 运 行 的 例子 中 ,使 用 了 ssh 命令 从 机 器 1 登录 到 机 器 2. 
此 时 仍 登 录 在 机 器 1 上 ,但 是 在 机 器 2 上 却 运行 了 一 个 shell 进程 。 该 shell 程序 
编译 并 运行 了 时 间 服 务 客户 端 。 

我 的 终端 确实 是 连接 到 机 器 上 了 。 重 新 画图 11. 11, 使 得 该 图 包含 机 器 1 上 的 
shell @L#E 2 FB shell, £t 45 L4 A JA timeclnt 到 终端 正确 的 数据 流 。 这 可 是 一 个 
相当 复杂 的 数据 流 哦 。 


前 面 的 章节 中 可 以 看 到 磁盘 文件 和 设备 文件 都 广 持 标准 的 文件 接口 ,人 是 到 磁 
盘 文 件 的 连接 与 到 设备 文件 的 连接 具有 完全 不 同 的 属性 集 。 那 么 socket 具有 什 
A FERS RS FEUET 218] setsockopt 的 帮助 手册 以 获取 更 详细 的 信息 。 


远 端 目录 服务 运行 了 is 命令 。 当 1s RAR RS RETA RI? p 
如 ,指定 的 旦 录 不 存在 或 对 于 服务 器 而 言 不 可 读 , 那 么 对 于 所 产生 的 错误 信息 如 
何 处 理 呢 ? 可 以 考虑 两 种 处 理 来 自 1s 的 错误 信息 的 方法 。 首 先 , 如何 把 错误 信 
息 发 回 给 客户 端 ? 其 次 ,如 何 把 错误 信息 存放 到 日 志 中 并 通知 用 户 ? 


4. 编程 练习 | 
11.6 给 tinybe 程序 增加 一 选项。 一 旦 增加 了 该 选项 ,下 面 的 命令 将 能 够 工作 


printf "2 +2\n4 * 4\n"|tinybe - c|dc 


11.7 为 你 的 shell 增加 一 c 选项 。 需要 改变 什么 呢 ? 


11. 8 


编写 pelose 程序 。 该 函数 以 popen 返回 的 FILE * 作 为 参数 。faopen AAAA 
存 和 藉 记 信息 分 配 了 内 存 空 回 。felose BRB RIKA THK RAIA. FB 
4 pelose 还 必须 做 些 什 么 呢 ? 若 另 一 个 子 进 程 死 在 popen 和 pelose 调用 之 问 ， 


il.10 


11. 11 


I1. 12 
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结果 又 将 会 怎样 ? 
本 章 中 的 时 间 服 敌 占 并 没有 用 到 系统 调 内 accept 所 提供 的 调用 者 ID 的 特性 。 
ie timeserv. c; 使 得 它 在 接收 到 请 求 时 可 以 打印 出 如 Got a call from 123. 123. 


123. 123 (computer2. mysite, net}. 


可 以 阅读 帮助 手册 和 头 文件 来 了 解 该 工程 中 所 需要 的 函数 和 结构 体 . 


写 一 个 程序 将 sort 作为 子 程序 调用 。 程 序 须 读 取 多 行 数据 ,存放 到 字符 串 数 组 
中 。 接 着 程序 创建 师 个 管道 ,然后 创建 - -个 进程 来 运行 sort. iii — TR E E 
输入 序列 发 送 给 sort 的 输入 ,再 关闭 该 管道 。 通过 男 一 个 管道 读 取 sort 的 条 
出 .再 把 结果 存 四 数组 中 ,并 打印 该 数组 ， 

基于 System V 的 Unix 版 本 提供 了 对 双 问 管道 的 支持 。 通 这 运行 下 面 的 程序 ， 
可 以 测试 某 个 版 本 的 Unix 是 罕 支 持 双 问 管 道 ， 


! 
JC 


* testbpd.c 一 test bidirectional pipes 


x, 
maint } 
int p|2]; 
if ( pipe(p) == - 1) exit(1); 
if ( write(p[0;, "hello", 5) == -1) 
perror( "write into pipe[ 0 | failed". 
else 


printf("write into pipe[0 | worked\n") ; 
| 

在 内 部 , 双 疝 管道 含有 两 个 队列 , 一 个 从 pipeL0j] 到 pipeL1], 另 一 个 则 方向 相反 。 
占 管 道 的 一 问 写 数据 操作 会 把 数据 放 人 到 通 向 另 一 端的 队列 中 ,而 从 管道 的 一 
问 访 数据 则 将 数据 从 那 问 取 电 并 送 入 本 端的 队列 中 ， 
如 果 你 的 系统 不 或 持 双 向 管道 ,可 以 生成 如 下 调用 : 

# include <I sys/ types. h 

# include < sys/ socket. h> 

int apipel2:;  /* a pipe «; 

socketpair( AF UNTX, SOCK_STREAM, PF UNSPEC, apipe); 


时 新 编制 程序 tinybe.c, 使 它 使 用 一 个 双向 管道 而 不 是 使 用 两 个 单 向 的 管道 。 


SEP nmeserv. c 程序 ,使 得 它 只 啊 应 来 自 特定 IP Hk EBL A Pe. AR HE 
收 呼出 并 检查 客户 端 地 址 。 如 有 果 客 户 壮 地 址 不 是 特定 的 1P. RE AE ER FED OU 
W] ,服务 器 将 时 间 返 回 。 

增强 该 姐 繁 特征 使 服务 器 可 以 从 文件 中 读 取 所 能 接收 的 IP 地 址 列 宕 。 描 述 该 
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技术 的 一 些 实际 应 用 。 


大 家 知道 在 服务 器 端 使 用 popen 调用 是 非常 危险 的 有 两 种 方法 来 解决 该 问 
题 。 第 一 种 方法 是 编写 一 个 更 加 灵活 ,但 非常 安全 的 sanitize HH. MU, Bax 
名 中 允许 含有 过 号 . 破 折 号 .空格 和 其 他 字符 。 并 且 上 月 录 名 中 还 可 以 售 有 是 导 
和 分 号 ,这 个 处 理 可 以 像 shell 一 样 ,给 这 此 字符 赋 于 特定 的 含义 。 写 一 个 时 如 
有 用 的 ,但 是 安全 的 字符 电解 析 函 数 。 

另外 一 种 方法 是 放弃 使 用 popen; 用 fork exec 和 dup 等 图 数 。 用 这 种 方法 来 重 
S rlsd,c 程序， 其 中 需要 用 到 wait 吗 ? Aira? 


编写 -- 个 位 于 端口 79 的 目录 辅助 服务 器 (finger 服务 占 ) 。 服 务 器 接收 单行 的 
AP SRA ARE ARTA APRA SMALE RA AP. 


代理 Cproxy) 指 的 是 接收 请 求 ,把 该 请 求 转 发 给 其 他 的 服务 器 ,然后 再 将 从 服务 
器 中 传 回 的 结果 返回 络 程序 。 这 就 类 们 于 干洗 店 的 前 台 : 它 不 做 清洁 工作 ,只 
是 把 衣服 传送 到 洗衣 设备 或 从 洗衣 设备 取 衣 服 。 

缩 瑟 一 个 时 间 报 务 髓 代理 ,你 的 程序 应 当 可 以 接收 标准 端口 上 的 连接 。 为 了 
处 理 该 连接 ,程序 需要 和 真 的 时 间 服 务 建 立 连 接 , 从 该 服务 器 取得 时 间 ,然后 把 
时 间 转 发 给 客 户 端 ， 


考虑 上 一 题 中 的 关于 代理 服务 器 的 概念 。 时 间 只 是 每 秒 钟 政变 一 次 ;如 果 你 的 
代理 服务 器 在 几 点 秒 中 接收 了 很 多 请 求 ,就 根本 不 可 能 在 这 从 短 的 时 间 内 向 时 
间 服 务 嚣 发送 许多 请 求 。 编 写 一 个 时 间 代 理 服 务 狠 ,可 以 缓存 从 时 间 服 务 器 读 
取 的 时 间 , 只 有 在 新 的 呼叫 超过 了 1 秒 和 的 间隔 之 后 才 去 向 时 间 服 务 器 发 送 请 求 
(参见 gettimeofday) , 


X^ RD UA d E RB vj B HO ZEE P IST IR] B. Se E — 7 A SIE. IB FE finger 
RS ae PRA RAE A RR. 8 TS Hook 8 BE HE aE E 
其 可 以 缓存 用 户 信 息 。 

缓存 时 间 服 务 器 中 所 缓存 的 每 个 元 素 都 有 白 然 的 生命 周期 (1 EP bo [B E ip RE 
存 的 目录 辅助 服务 器 中 如 和 何 决定 用 户 信息 的 保存 时 间 呢 ? 


AERO A-BRR AO RRS YE. BALLS Re EARS WSL 
gos f TREBAS. WITS PUB S AE ES BR ee HE Sr 88 
系统 。 上 服务 顺产 生 连 续 编 导 。 用 户 运 行 客 户 端 程序 来 获取 服务 器 端的 数字 。 


每 个 C 程序 员 都 知道 argv[0] 通 常 表示 正在 运行 的 程序 名 称 。 有 一 种 比较 接近 
的 方法 可 以 使 一 个 进程 获得 自己 的 名 字 。 程 序 可 以 使 用 popen: 然后 从 ps 命令 
的 输出 中 来 搜索 自己 的 进程 ID。 纺 写 一 个 使 用 该 方法 的 程序 。 
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概念 与 技巧 

*。 ARS as socket. HW ED 

。 客户 端 socket: 目的 和 构造 

。 客户 /服务 器 协议 

> 服务 器 设计 : 使 用 fork 来 接收 多 个 请 求 
© 僵尸 (zombie) 问 题 

+ HTTP 


12.1 服务 器 设计 重点 


使 用 万 维 网 是 容易 的 ,只 要 在 浏览 器 中 输入 一 个 网 址 或 者 单 击 一 个 超 链 , 版 务 器 就 会 把 
相应 的 网 页 发 送 过 来 。 但 是 Web 是 怎样 工作 的 ? 从 Web 服务 器 上 获取 网 页 和 从 时 间 服 务 
髓 获取 时 间 是 类 似 的 吗 ? 

基于 socket 的 客户 /服务 器 系统 大 多 是 类 做 的 。 虽 然 电 子 邮 件 . 文 件 传输 .远程 登录 利 
分 布 式 数据 库 , 以 及 其 他 的 Internet 服务 在 屏幕 上 显示 的 内 容 相 异 ,但 是 它们 的 运作 原 埋 是 
一 致 的 。 

一 旦 理解 了 一 个 socket 流 的 客户 /服务 器 系统 ,就 可 以 理解 大 密 数 其 他 的 系统 。 在 本 章 
中 ,将 学 习 网 络 编程 的 基本 操作 和 设计 原则 ,然后 使 用 它们 来 建立 一 个 Web B ARS. 


12.2 二 个 主要 操作 


在 第 11 章 看 到 的 基于 socket 流 的 客户 /服务 器 系统 与 图 12.] 看 上 去 类 似 。 客 户 和 上 服 
务 器 都 是 进程 。 服 务 器 设立 服务 ,然后 进入 循环 接收 和 处 理 请 求 。 客 户 连 接 到 服务 器 ,然后 
发 送 .接受 或 者 交换 数据 ,最 后 退出 。 该 交互 过 程 中 主要 包含 了 以 下 3 个 操作 : 

(1) 服务 器 设立 服务 。 

(2) 客户 连接 到 服务 回 。 

(3) 服务 器 和 客户 处 理事 务 。 
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设立 服务 
EBENE  ---------------- > ”接收 请 求 
DORIS 55 提供 服务 | 
FEIT Rr 挂 断 连接 
图 12, 1 客户 /服务 器 交 互 中 的 主要 步骤 
下 面 将 分 别 讨论 每 个 探 作 ， 


12.3 操作 1 和 操作 2: 建立 连接 


基于 流 的 系统 需要 建立 连 护 这 里 将 回顾 一 下 建立 连接 的 步骤 ,然后 将 这 些 步 又 抽象 
gk, — E FF PR XX 


12. 3. 1 操作 1: 建立 服务 器 端 socket 


首先 .如 图 12. 2 所 示 a SIR I TRS HE. RU TRS Mi BOF 
3 个 步骤 : 
(1) 创建 一 个 socket 
socket = socket(PF INET, SOCK STREAM,O) 
给 socket £i ze — ^T Jti hl 
bind(sock, &addr, sizeof(addr)) 
(3) 监听 接 入 请 求 


listen(sock, queue size) 


(2 


et 


WI l: 
AR—TRA Bit sockel 





12.2. ORAR socket 


a 
C AJ 
xj 


52 >» Urnix/Linux Sa T2 3 He $4 P$ 


为 了 避免 在 编写 服务 器 时 重复 输入 上 述 代码 .将 这 3 SE RO RH ERES make 
seTver_socket， 该 转 数 的 代码 位 于 本 章 后 面 将 给 出 的 socklib. c 文件 中 。 在 编写 服务 器 的 时 
候 .只 要 调用 该 轴 数 就 可 以 创建 一 个 服务 器 端 socket。 具 体 如 下 


sock = Dake_Server socker( int portnum) 


return — 1 if error, 


ora server socket listening at port "portnum” 


12.3.2 操作 2: 建立 到 服务 器 的 连接 


其 次 ,将 客户 连接 到 服务 器 。 如 图 12. 3 Br zw ,基于 流 的 网 络 客户 连接 到 服务 器 包含 以 下 
两 个 步 又， 

(1) 创建 一 个 socket 

socket = socket(PF INET, SOCK STREAM, 0) 
(2) 使 用 该 socket PE Be BARS BE 
connect(sock, S$serv addr, sizeof(serv addr)) 

LM P Sp aR DN He wk — M s connect to. server. MRF A PUE. 从 发 珊 用 该 图 数 就 可 以 建立 

SERS eek Be 其 体 如 下 : 


fd = connect -O server(hostname, portnum) 


return c laf error. 


or a fd open for reading and writing connected to the socket at port “portnug” on host "hostname" 






DIRQ: 创建 并 
Xt *& & P? socket — 


HIIR 55 25 


Pj 12.3 seg Sag FB 


12.3.3  socklib. c 


/* SOCklib c 


» This file contains functions used lots when Writing internet 


~ ctlien"/server programs. The two main functions here are. 
* int make server socket( portnum ) returns a gerver socket 
x Or - l if error 


* int make server socket q(portnum ,backlog) 


* int connect to server(char x hostname, int portnum) 


A — a a «9 n P— , MM 


ee e T le T shi i as nil i is — 7 —' 
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x returns a connected socket 
x Or 1 if error 
xf 


i include <(stdio. h> 

# include «unista. ho 

# include < sys/types. h> 
HĦ# include «sys / socket. hz» 
# include «< netinet/in. h> 
# include <inetdb. hi> 

# include -< time. h> 


# include — «istrings.h-— 


# def ine HOSTLEN 256 
H define BACKLOG 1 


int make server socket g(int , int 5; 


int make server socket(int portnum) 


{ 


return make server socket g(portnun, BACKLOG) ; 


t 
int make server socket gí(int portnum, int backlog) 


struct sockaddr in saddr; /* build our address here »/ 
struct hostent * hp; /* this is part of our */ 
char  hostnane|HOSTLEN !; /* address x/ 

int Sock, id; /* the socket «/ 

sock id = socket(PF INET, SOCK STREAM, 0); /* get a socket x/ 

if ( sock id == -1) 


return — l; 


/* * build address and bind it to socket * *; 


bzero((void + J&saddr, sizeof(saddr)); /* clear out struct «/ 
gethostname( hostname, HOSTLEN): /* where am I ? «/ 
hp = gethostbyname( hostname) : /* get info about hosti */ 


/* fill in host part x/ 
bcopy( (void * hp- >h addr, (void * J&saddr.sin_addr, 
hp- +h length): 
saddr.sin port = htons(portnum); - /* Fill in socket port x/ 
saddr.sin family = AF INET ; /* fill in addr family */ 
if ¢ bind(sack id, (struct sockaddr * j&saddr, 
sizeof€(saddr}) 1= 0) 


return — 1; 


/* * arrange for incoming calls x */ 


ee Rr en i ER Ren ll re 
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if ( listen(sock id, backlog} [= 0) 
return — 1; 
return sock id; 


| 


int connect to server(char * host, int portnum) 


{ 


int sock ; 
struct sockaddr in servadd; /* the number to call «/ 
struct hostent * hp; /* used to get number x/ 


/* * Stepl. Geta socket * x/ 


sock = socket( AF INET, SOCK STREAM, 0 }; /* get a line */ 
if( sock == -1) 


return — 1; 
/* » Step 2, connect to server = «x/ 


bzero( &servadd, sizeof(servadd) ); /* zero the address «/ 
hp = gethostbyname( host }; /* lookup host's ip # x/ 
if (hp == NULL} 

return — 1; 
bcopy(hp- —h addr, (struct sockaddr » )&servadd. sin addr, 

hp- —h length); 
servadd.sin port = htons(portnum); /* fill in port number «/ 
servadd.sin family = AF INET ， /* fill in socket type */ 


if ( connect(sock, (struct sockaddr * }&servadd, 
sizeof(servadd)) |- 0) 
return - 1; 


return sock; 


12.4 RE3: RPMS 


至 此 ,可 以 使 用 专门 的 函数 来 建立 服务 器 端的 socket, 同 时 也 有 专门 的 函数 来 连接 到 服务 器 ， 
FESO RE Oi ALA POR RRO? 客户 和 服务 器 之 间 的 交互 内 容 又 是 什么 呢 ? 在 本 节 中 ,将 学 习 
客户 端 程序 和 服务 器 端 程序 编号 的 一 般 形 式 , 以 及 一 些 建立 服务 器 的 设计 方案 。 

1. 一 般 的 客户 端 

网 络 客 忆 通常 调用 服务 器 来 获得 服务 ,一 个 几 型 的 客户 程序 如 下 : 


maint } 
{ 
int fd; 


fd = connect to server(host,port); /x call the server «, 
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if(fd == -1) 

exit(1); /* or die 9/ 
talk with server(Fd); /* chat with server x/ 
close(fd); /* hang up when done +/ 


! 


PRA talk with, server ARGS RHEA., 具体 的 内 容 取 决 于 特定 应 用 , ftn, 
e-mail 客户 和 邮件 服务 器 交谈 的 是 邮件 .而 天 气 预 报 客户 种 服务 器 交谈 的 则 是 天 气 ， 
2. 一 般 的 服务 器 端 


一 个 典型 的 服务 器 如 下 : 
nain() 
p 
int sock, Fd; /* socket and connection */ 
sock = make server socket(port); 
if(sock == -1) 
exit(1); 
while(l) 
( 
£d = accept( sock , NULL, NULL) ， /a take next call «/ 
if(fd == —)) 
break ; /(* or die */ 
process request(fd); /* chat with client «/ 
close( fd); /* hang up when done x/ 


) 
} 


PRX process_request 处 理 客户 的 请 求 。 具 体 的 内 容 取 决 于 特定 应 用 。 例 如 ,邮件 服务 
器 告诉 客户 信件 信息 ,天 气 服务 器 则 告诉 客户 天 气 情况 。 
12.4.1 使 用 socklib.e 的 timeserv/timeclnt 

如 何 利 用 上 面 的 和 模板 来 建立 客户 /服务 器 系统 呢 ? 例如 ,在 该 框架 下 本 文 的 时 间 系 统 客 


户 / 服 务 嚣 是 怎样 的 呢 ? 图 12. 4 对 此 做 了 解释 。 为 了 使 用 socklib. c 重 写 时 间 客 户 和 服务 
证 ,这 里 编写 了 处 理会 话 的 虹 数 talk_with_server 用 于 客户 端 ,而 process request 用 于 服务 





的 12.4 时 间 服 务 跨 和 客户 站 版 本 1 
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器 端 。 

talk with servert Fd) process request( Fd) 

( { 
char buf[ LENT; time t now; 
int n; char * Cp; 

time (know); 

n= read( £d, buf, LEN) ; Cp? ctime(&now); 
write(i1,buf,n); write(fd,cp,strlen(cp)); 


! | 


服务 跨 调 用 vi me 从 内 核 中 获得 时 间 , 然 后 用 ctime 将 时 间 和 转换 成 可 以 打印 的 字符 捉 ， 
服务 器 将 该 字符 串 写 到 socket 中 ,发送 给 客户 端的 socket, BPM socket f ERU TER S, 
然后 写 到 标准 输出 中 。 这 个 新 的 版 本 遵循 了 先前 版 本 的 程序 有 远 辑 , 但 是 设计 更 加 模块 化 , 代 
码 更 加 清晰 。 


12.4.2 第 2 片 的 服务 器 : 使 用 fork 


现在 考虑 第 二 版 服务 侨 的 设计 。 第 二 版 中 程序 没有 通过 调用 time KA AI E TR] 
的 数据 ,而 是 直接 使 用 了 一 个 shell 命令 (date 命令 ) ,如 图 12.5 Bro, 





E 12.5 服务 器 使 用 fork 运行 date 


代码 如 下 : 


process, request(fd) 
hs 
* send the date out to the client via fd 
« / 
( 
int pid = fork(): 


switch( pid) 
cage —}:return; /* can not provide service «/ 
case 0;dup2(fd,1); /* child runs date x/ 
close(fd); /* by redirecting stdout «/ 


execl("/bin/date", "date", NULL); 


oops( "execlp"); . /* or quits «/ 
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oea: o o0 » mo 


default, wait(NULL):; /* parent wait for child x/ 


i 


如 图 12.5 所 示 , 服 务 器 用 fork £r — T dB TERR. T EE Ts E S6) Hh EB 
socket' 然 后 运行 date, date f ta FA. RIA AAS SE S A US 
HAPT. EF PRA T wait. shell 通常 在 调用 fork 后 要 调用 wait, A Aix HLA 3H 
4 EX? 本 文 将 在 下 一 节 中 探讨 该 问题 。 


12.4.3 ARS eI ow: DIY 或 代理 


这 里 使 用 了 两 种 服务 器 的 设计 方法 : 

* 自己 做 (Do It Yourself, DIY? RS aR. A Osh ee. 

。 代理 一 服务 器 接收 请 求 ,然后 创建 一 个 新 进程 来 钼 理工 作 . 

每 种 方法 的 优 瞧 点 各 是 什么 ? 

。 自己 做 用 十 快速 简单 的 任务 

计算 当前 的 日 期 和 时 间 需 要 系统 调用 time 各 库 函数 etime。 使 用 fork 和 exec 来 运行 


$5 E CX 5E L IEH BE listen 中 限制 连接 队列 的 大 小 。 文 件 socklib. c 中 的 make server 
socket q 图 数 以 队列 大 小 作为 参数 。 

> 代理 用 于 慢 速 的 更 加 复 洒 的 任务 

服务 侨 处 理 耗 时 的 任务 或 等 待 资源 时 ,需要 代理 来 完成 其 工作 。 这 就 像 商务 中 的 电话 
接线 员 ,接收 电话 ,把 连接 传递 到 下 一 个 销售 或 服务 人 员 ,然后 再 回 过 去 接收 下 一 个 电话 ,而 
服务 器 可 以 使 用 fork 蚀 建 一 个 新 进程 来 处 理 每 个 请 求 。 通 过 这 种 方式 ,服务 器 条 以 同时 处 
理 多 个 任务 。 

* 使 用 SIGCHLD XIE F (zombie) 问题 

除了 等待 子 进程 死亡 外 , 父 进程 可 以 设置 为 接站 表示 子 进程 死亡 的 信号 . 第 8 章 中 解释 
了 当 了 于 进程 退出 或 被 终止 时 ,内 核发 送 SIGCHLD 给 父 进程 。 但 它 不 同 于 本 六 讨论 的 其 他 信 
SON ABI SIGCHLD 是 被 忽略 的 。 父 进程 可 以 为 SIGCHLD 设置 一 个 信号 处 理 晴 数 , 它 吕 
以 调用 wait。 具 体 方法 如 下 : 


/* naive use of SIGCHLD handler with wait(? - buggy */ 
maint ) 
{ 
int sock, fd; 
void child_waiter(int) , process request(int); 
sigqnal{ SIGCHLD, child_waiter) ; 
if( (sock = nake server socket(PORTNUM)) = = - 1) 
oops("make server socket"). 
j 
whiletci? ! 
fd = accept( sock , NULL, NULL) ; 
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ifffd== - 1) 
break; 
process request(fd), 
close(fd); 
Y 
í 


\ 
1 


void child waiter(int signum) 


Walt(NULL): 
i 
void process request(int fd) 
{ 


if(fork() == 0) | /* child */ 
dup2(fd,1); /* moves socket to fd 1 */ 
close{ fe) ; /s closes socket x/ 


exacIp¢ "data", "date", NULI); /x exec date */ 


oops("execlp date"; 
} 
} 


下 面 来 分 析 程 序 中 的 流程 控制 。 当 一 个 请 米 过 来 时 , 父 进程 使 用 fork ,然后 父 进程 立即 
返回 去 接收 下 一 个 请 求 , 让 子 进程 去 处 理 请 求 。 当 子 进程 退出 时 , 父 进 程 收 到 SIGCHLD fA 
1$ .BESIAP ESO EG) wait。 子 进程 从 进程 表 中 被 删除 , 父 进程 内 处 理 图 数 退 回 到 主力 
数 。 该 过 程 看 上 去 似乎 很 元 美 了 , 趟 过 其 中 存在 着 两 个 问题 。 

问题 1 ”是 程序 运行 到 和 售 史 处 理 国 数 跳 转 时 会 中 断 系 统 调 用 accept。 当 accept 被 信号 
中 新 时 ,巡回 一 1 ,然后 设置 errno 9| EINTR。 代 码 中 把 accept 返回 的 一 1 作为 错误 ,然后 从 
主 循环 中 跳出 来 。 这 里 需要 更 改 main 函数 来 区 分 真正 的 错误 和 被 打 断 的 系统 调用 所 产生 
的 错误 。 这 个 作为 练习 ;由 读者 完成 。 

问题 2 关于 Unix 是 如 何 处 理 多 个 信号 的 。 如 果 多 个 于 进程 几乎 同时 退出 ,将 会 发 生 
什么 ?假设 同时 有 3 个 SIGCHLD 发 送 到 多 进程。 最 驳 到 达 的 信和 号 导致 父 进程 跳 到 处 理 病 
数 , 然 后 父 进程 调用 wait 来 保证 子 进 程 已 经 从 进程 表 中 删除 。 这 样 就 可 以 了 吗 ? 

SBA SA AAP fae Ss eo ASA Unix 限 塞 , 但 是 并 不 缓存 
信号 。 从 而 ,第 二 个 信号 被 阻 赛 , 而 第 三 个 信号 丢失 了 、， WN MRA PRR. 
来 自 于 这 些 子 进 程 的 信号 也 将 于 和 失 。 信 号 处 理 果 数 只 调用 了 wat 一 次 ,所 以 和 拇 次 丢失 一 个 
信号 意味 着 少 调 用 了 -次 wait, 这 将 产生 更 多 的 僵尸 进程 (zombie)。 解 决 方法 是 在 处 理 栈 数 
中 调用 wait 足够 多 的 次 数 来 去 除 所 有 的 终止 进程 。waitpid 函数 解决 了 此 问题 : 


void child waiter(int signum? 


Í 
i 


while(waitpidi - 1,NULL,WNOHANG) 70); 
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waitpid 提供 了 wait 函数 超 集 的 功能 。 其 第 一 个 参数 表示 它 所 要 等 待 的 进程 了 号. (B 
一 ! 表示 等 待 所 有 的 子 进程 。 第 二 个 参数 是 指 同 整 型 值 的 指针 ,用 来 获取 状 人 在。 服务 站 并 个 
关心 子 进程 中 发 生 了 什么 .不 过 一 个 健壮 的 服务 器 可 能 用 该 信息 米 跟 踪 错 误 。 

waitpid 的 最 后 一 个 参数 表示 选项 ，WNOHANG 参数 告诉 waitpid: WR X S EF E 
A AD SERE. 

Vx ia A a El BE i Hy B Pe Pe eB a ETA. Bf e T XERISUDBUXI ET 
# SIGCHLD fà Wik Ha t dp HK ALB, 


12.5 编写 Web 服务 器 


至 此 .已 经 学 习 了 编写 Web 服务 器 的 必 备 知识 。Web 服务 器 是 已 经 编写 的 目录 服务 器 
的 扩展 。 主 要 的 扩展 是 一 个 cat 服务 器 和 一 个 exec 服务 器 。 


12.5.1 Web 服务 器 功能 


Web 服务 器 通常 要 具备 3 AAP IR : 
(D WEB Rae. 

(2) cat 文件 。 

(3) BEF. 





图 12.6 Web ES oh fe et FE Is cat exec 


Web Ak + ae il ca FPL socket 连接 为 客户 提供 上 述 3 种 操作 。 如 图 12.6 所 示 ,用户 
连接 到 服务 器 后 ,发送 请 求 , 然 后 服务 器 返回 客户 请 求 的 信息 。 自 体 过 程 如 下 ， 


sivas Ws mn 
用 户 选择 -- 个 链接 
连接 服务 器 ”一 Bun 
Sj 请 求 pi vimm 
处 理 请 求 : 
目录 :显示 目录 列表 
文件 :显示 内 容 


不 存在: 错误 消息 
ER for s -— 写 应 答 
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TE 

显示 应 省 
html :解析 
image : 2 Ki 
sound: 运行 


m Š 
12.5.2. 设计 Web BR $5 as 


所 要 编写 的 操作 如 下。 

(OD 建立 服务 器 

是 以 使 用 socklib. 中 的 make server socket, 

(2) 接收 府 求 

使 用 accept 来 得 到 指向 客户 端的 文件 描述 符 。 可 以 使 用 fdopen 使 得 该 文件 描述 符 转换 
成 缓冲 流 。 

(3) 读 取 请 求 

什么 起 一 个 请 米 ? SP HR RAR? RHR RHEE, 

(4) 处 理 请 求 

已 经 知道 了 如 何 列 出 日 录 信 息 、cat 文件 以 及 运行 程序 。 通 这 opendir 和 readdir、open 
和 read、dup2 和 exec 的 使 用 可 以 实现 上 述 功能 。 

(5) 发 送 应 管 

什么 是 一 个 应 洛 ? SP mR RETA? 这 些 也 需要 进一步 地 学 习 。 至 此 ,已 
经 学 习 了 几乎 所 有 的 编写 Web 服务 器 的 知识 和 技能 ， 所 剩 的 是 Web 服务 器 协议 的 掌 习 。 


12.5.3 Web 服务 器 协议 


客户 端 ( 浏 览 器 ) 与 Web 服务 器 之 间 的 交互 主要 包含 客户 的 请 求 和 服务 器 的 应 答 。 请 求 
Ri pr 258 B P a TE RB XC fiin CIT TP) rog X. HTTP 像 上 一 再 中 的 时 间 服 务 回 和 
finger 服务 器 的 协议 一 样 ,使 用 纯 文 本 。 就 像 在 时 间 服 务 器 和 finger 服务 器 中 所 做 的 ， 这 里 
可 以 使 用 telnet 和 Web IRB AUD. Web 服务 器 在 端口 80 监听 。 下 面 是 一 个 实际 的 
例子 : 


5 telnet www, prenhall. com 80 
Trying 165. 193. 123.253... 
Connected to www.prenhall.com. 
Escape character is '^;'. 


GET /index. html HTTP/1.0 


HTTP/1.1 200 OK 

Server , Netscape  Enterprise/3.6 SP3 
Date. Tue, 22 Jan 2002 16,11.14 GMT 
Content — type: text/html 
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ee — 


Last - modified.Fri, 08 Sep 2000 20.20.06 GMT 
Content — length:327 

Accept 一 ranges, bytes 

Connect ion: clase 

HTML <2 HEAD > 

< META HTTE-EQUIV = "Refresh"CONTENT = "0; 
URL = http; //vig. prenhall. com, ">> 

<< {MEAD << BODY >> << /BODY >> «c / HTMLI> 


Connection closed by foreign host. 


$ 


jx LH AGE TTR HER TST Ka. AA? 

1. HTTP È Æ.: GET 

telnet 创建 了 一 个 socket 并 调用 了 connect 来 连接 到 Web 服务 器 ， 服 务 器 接受 连接 请 
来 ,并 创建 了 一 个 基于 socket 的 从 客户 端的 键盘 到 Web 服务 进程 的 数据 通道 ， 

接 下 来 , 输 人 请 求 : 


GET /index. htm! HTTP/1.0 


一 个 HTTP 清 求 包 含有 3 个 字符 串 。 第 一 个 字符 申 是 命令 ,第 一 个 是 参数 ,第 三 个 是 所 
用 协议 的 版 本 号 。 在 该 例子 中 ,使 用 了 GET 命令 ;以 index, html 作为 参数 ,使 用 了 HTTP 
版 本 1.0。 

HTTP 还 包含 儿 个 其 他 的 命令 。 大 部 分 Web 请 求 使 用 GET, 因 为 大 部 分 时 间 中 用 户 是 
单 击 链接 来 获取 网 页 。GET 命令 可 以 跟 几 行 参数 。 这 里 使 用 了 简单 的 请 求 ,以 一 个 空 行 来 
表示 参数 的 结束 ,并 使 用 与 本 书 前 面 提 及 的 关于 shell 的 相同 约定 。 实 际 上 ,一 个 Web RH 
器 只 是 集成 了 cat F is $ Unix shell, 

2, HTTP & €: OK 

ARF SEVEGUBCK ,检查 请 求 , 然 后 返回 一 个 请 求 。 应 答 有 两 部 分 : 头 部 和 内 容 。 头 部 以 
状态 行 起 始 , 如 下 所 示 ; 


HTIP/1.1 200 GK 


状态 行 含 有 商 个 或 更 多 的 字符 申 。 第 一 个 捉 是 协议 的 版 本 ,第 二 个 串 是 返回 码 , 这 里 
是 200, 其 文本 的 解释 是 OK。 这 里 请 求 的 文件 叫 /info. btml; 而 服务 器 给 出 应 管 表示 可 以 
得 到 该 文件 。 如 果 服 务 禹 中 没有 所 请 求 的 文件 名 ,返回 码 将 是 404, 其 解释 将 是 “未 找到 ”。 

头 部 的 其 余部 分 是 关于 应 答 的 网 加 信息 。 让 该 例子 中 ,附加 信息 包含 服务 姓名、 应 管 时 
间 \ 服 务 器 上 所 发 送 数据 类 型 以 及 应 答 的 连接 类 型 。 一 -个 上 应答 头 部 可 以 世人 全 有 多 行 信息 ,以 空 
行 表示 结束 ,; 空 行 位 于 Connection:close 后 面 。 

应 答 的 其 余部 分 是 返回 的 具体 内 容 。 这 里 ,服务 器 返回 了 文件 /index. html HAF. 
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3. HTTP tä 

EP mA web 服务 器 侈 五 的 基本 结构 如 下 : 
(1) 客户 发 送 请 求 

GET filename HTTP/version 

Hy xt 2 

S 

(2) 服务 器 发 送 应 答 


HTTP/version status-code status- message 


附和 信息 
空 行 
内 容 


协议 的 完整 描述 可 以 参阅 网 上 的 版 本 1.0 的 RFC1945 和 版 本 1.1 的 RFC2068, 


Web 服务 器 必须 接收 客户 的 HTTP 请 求 , 并 发 送 HTTP 应 答 。 请 求 和 应 管 采用 纯 文 本 


格式 ,是 为 了 恒 于 使 用 CC 中 的 输 人 /输出 以 及 字符 串 丽 数 读 皮 和 处 理 。 
12.5.4 编写 Web 服务 器 


BK Web 服务 器 只 支持 GET fito REOR RKI PEG HR BW PAG RE OR A eK 


应 答 ,主要 循环 如 下 ; 

while(1) 

| 
fd = accept(sock, NULL, NULL) ; /* take a call */ 
fpin- fdopen(fd, "r"); /» make it a FILE« «/ 
fgets(fpin, request , LEN) ; /* read client request x/ 
read until crni(fpir); /* Skip over arguments x/ 
process rq(request,fd); /* reply to client x/ 
fclose(fpin); /* hang up connection */ 

I 

M Tf eS, iX ELS M Fon pt dr. 

l. 处 理 请 求 


处 理 请 求 包 售 识别 命令 和 根据 参数 进行 处 理 ， 


process rg( char * rg, int fd ) 


í 
char cmd| 11], arg[513]; 


if C fork() t= 0 } /* ifa child, do work »/ 


return; /* if parent,return x/ 


sscanf(rq, "* 10s *512s", cmd, arg); 


r 


if ( stremptemd, "GET") I= Q) /* check command +, 
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cannot do(fd): 


else if ( not exist( arg ) ) /* does the arg exist */ 
do 404(ara, fd); /* n: tell the user x/ 
else if ( isadir( arg) } /* is it a directory? */ 
do ls( arg, fd 5; /* y. list contents x*/ 
else if ( ends in cgi( arg ) ) /* name is X. cgi? */ 
do exec( arg, Fd}; /* y, execute it x/ 
else /* otherwise */ 
do cati arg, fd}; /* display contents */ 


f 


A SBA TK IE TRO. TERA Ra Emo AAR MR 
命令 不 是 GET ,服务 器 应 等 HTTP 返回 码 表示 未 实现 的 命令 。 如 果 命 令 是 GET.8RÓ G4 
HMR A RA. TE. cgi 结尾 的 可 执行 程序 或 文件 和 名。 如果 没 有 该 日 录 或 指定 的 文件 
名 ,服务 器 报错 。 

如 果 存 在 目录 或 文件 ,服务 此 决 定 所 要 使 用 的 操作 : ls exec 或 eat, 

2. 目录 列表 函数 
PREX do ls 处 理 列 出 目录 信息 的 请 求 : 


do istchar * dir, int fd} 
i 


FILE * fp - 

fp = fdopen(fd,"w");. /* make socket into a FILE * x/ 
header(fp, "text/piain'); /* send HTTP reply header +,’ 
fprintf(fp, Arn"); /* and end of header mark x; 
fflush(fp); /* force to socket »/ 
dup2(fd,1); /* make socket stdout x/ 
dup2(fd,2); /* make socket stderr «/ 
close(fd) ; /* close socket x/ 


execl("/bin/ls","ls","— 1",dir,NULL); /* ls — 1 does the work */ 
perror(dir); /* or it doesn't »/ 
exittl}; /* child exits «/ 


| 


这 里 没有 像 前 面 章节 中 的 目录 服务 -一样 使 用 popen, 而 是 通过 调用 ls 命令 ,避免 了 客户 
in] shell popen 传递 任意 字符 串 来 运行 的 问题 。 

3. Jd E 

其 他 的 图 数 包 合 在 本章 的 后 面部 分 中 。 程 序 可 以 工作 ,但 它 并 不 完整 ,也 不 安全 。 需 要 
做 如 下 的 改进 : 

(1) APRE: 

(2) 缓存 溢出 保护 ; 
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(3) CGL Common Gateway Interlace HABA KBD REAR A EHAE: 


(4) HTTP 头 部 可 以 包含 更 多 的 信息 ， 
该 程序 是 一 个 包含 230 G C 代码 的 完整 的 Web 服务 器 ,包含 注释 和 空 行 。 


12.5.5. 运行 Web RS 
编 详 程序 ,在 某 个 端口 运行 它 ， 


5 cc webserv.c socklib.c - o webserv 


S ./webserv 12345 


项 在 可 以 访问 Web 服务 器 ,网 址 为 http: //yourhostname;12345/. X html 文件 放 到 该 
目录 中 并 有 是 用 http://yourhostname: 12345//filename. html 来 打开 它 。 划 建 下 面 的 shell 
脚本 

Bo! /bin/sh 

tf hello.cgi-a cheery cgi page 

printf "Content-type: text/plain\n\nhelio\n"; 


AE aT 为 hello. cgi, AA chmod 改变 权限 为 755, 然 后 用 浏览 器 调用 该 程序 : http. // 


yourhostname:12345/ hello. cgi. 
12.5.6  Webserv 的 源 程 序 
下 而 是 简单 Web IR Hao TUR: 


/* webserv.c a minimal web server (version 0.2} 
x usage: ws portnumber 


x features. supports the GET command only 


x runs in the current directory 

x forks a new child to handle each request 

* has MAJOR security holes, for demo purposes only 
* has many other weaknesses, but is a good start 

x build; cc webserv.c socklib.c - o webserv 

xg; 


d include  -—stdio. h> 
ț include  «Lsvs/types.hc— 
H include  «sys/staet. h> 


P include «string. hi 


main(int ac, char x av[] 
| 
int sock, fd; 
FILE — &fpin; 
char . request[ BUFSIZ |: 
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if (ac == 1}! 
fprintf(stderr, "usage, ws portnum\n"); 
exit(1); 

} 


sock = make server socket( atoi(av[1 p ); 


if ( sock == -1 ) exit(2); 
/* main loop here */ 


while(1){ 
/* take a call and buffer it »/ 
fd - accept( sock, NULL, NULL ); 


fpin = fdopen(fd, "r" ); 


/* read request x/ 
fgets(request,BUFSIZ,fpin); 

printf("got a call, request = $s", request); 
read til crnl(fpin); 


/* do what client asks x*/ 


process rq(request, fd); 


fclose(fpin); 


read til crnl(FILE » > 


skip over all request info until a CRNL is seen 


read til crnl(FILE * fp) 
{ 
char buf[BUFSIZ]; | 
while( fgets(buf,BUFSIZ2,fp) |= NULL && strcmp(buf, "ArXn") |= 0); 


process rq( char * rq, int fd ) 

do what the request asks for and write reply to td 
handles request in a new process 

rq is HTTP command. GET /foo/bar.html HTTP/1.0 


process rqd( char * rq, int fd) 


了 


char cmd| BUFSIZj, arg[ BUFSIZ;; 


/* Create a new process and return if not the child */ 
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if € fork() f= 0 } 


return: 


strepytarg, "./"); /* precede args with ./ */ 


if ( sscanftrg, "*€s5 s", cmd, arg t 2) f= 2) 


T 


return; 


if ( stremp(omd, "GET") I= QO} 
cannot do(fd); 
else if ( not exist( arg ) ) 
do 404(arqg, fd}; 
else if ( i1sadir( arg } } 
do ls( arg, fd); 
else if ( ends in cgi( arg) ) 
do execí( arg, fd}; 
else 
do cat( arg, fd}; 


the reply header thing: all functions need one 


if content type is NULL then don't send content type 


a xf 
header( FILE * fp, char * content type ) 
i 

fprintf(fp, "HTTP/1.0 200 OKXrXn'2; 

if ( content type ) 

fprintf(fp, "Content type; * sXrin", content type ); 

i 
(ees E a E x 

simple functions first. 

cannot do(fd) uninplemented HTTP command 
and do 404 item, fd) no such object 
—————— (€ —Ó———————— —À ee ye x / 


cannot do(int fd) 


J 
1 


FILE + fp = fdopen(fd,"w"); 


fprintf(fp, "HTTP/1,0 501 Not Implemented\r\n") ; 
fprintf(fp, "Content- type, text/plain\r\n") - 
fprintf(fp, "r\n"; 


fprintf(fp, "That command is not yet implemented. r\n"); 
Fclosetfp): 


r nnmn -一 
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do 404(char * item, int fd) 


d 


FILE ¥ fp = 


fprintf(fp, 
fprintf(fp, 


fprintf(fp, 


fprintf(fp, 
fclose(fp); 


the directory 
isadirí) uses 


do 1s runs ls. 


isadir(char * f) 


i 


fdopent fd, "w"); 


"HTTP/1.0 404 Not Found\r\n"} - 
"Content - type; text,plainyr\n")- 
Mryn") ; 


"The item you requested; $ s\r\nis not found\r\n", item); 


listing section 
stat, not existi) uses stat 


It should nat 


struct stat info; 
return ( stat(f, &info) [= - 1 && 5 ISDIR(info.st mode) ); 


not exist(char * f) 


f 
T 


struct stat info; 


return( stat(f,&info) == -1 ); 


do ls(char * dir, int fd) 


| 


FILE *fp: 


fp = fdopen(fd,"w"); 
header(fp, “text/piain™), 
fprintf(fp,"XrXn' 2; 


fflush(fp); 


dup2(fd,1); 
dup2(fd,2); 
close(fd); 


gxeclal "ls", 


perrorídir); 
exit l); 


"lg", " E" dir NULL; 


一 — — — 一 一 一 一 一 一 一 一 一 一 一 一 -一 一 .一 一 -- 证 ul MEM —————————— —————— 
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the cgi stuff. function to check extension and 


one to run the program. 


mmm — — — — — — —— — — 04 -一 一 一 一 一 一 一 一 一 一 一 一 一 


char * file type(char * f) 
/* returns 'extension' of file */ 
d 
char * Cp: 
if ( (cp = strrchr(f, '.' 9) |= NULL) 
return cp + l; 


ni. 


return 


t 


ends in cgi(char * fj 
1 

return ( strcmp( file type(f), "cgi" ) == 0); 
t 


do exec( char x prog, int fd) 
i 


FILE * fp; 


fp = fdopen(fd,"w"):; 
header(fp, NULL); 
fflusht(fp); 

dup2(fd, 1); 

dup2(fd, 2); 
close(fd); 

exec] (prog, prog, NULL) ; 


perror( prog} ; 


do cat(filename,fd) 


sends back contents after a header 


— — c —  — 8 —— c — 8 — c — c —— Kc — i = y F-— S Re A 


do cat(char * f, int fd) 
| 


char x extension = file type(f); 

char x content = "text/plain"; 

FILE * fpsock, * fpfile; 

int C; 

if ( stremplextension, html") == 0) 
content = "text/html"; 


else if ( stromp(extension, "gif") == 0) 
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content = "image/gif"; 

else if ( stremp(extension, "jpg") == 03 
content - "image/jpeg"; 

else if ( strempCextension, "jpeg") == Q} 


content = "image/jpeg": 


fosock = fdopen(fd, "w"); 
tpfile = fopen( f , "r"); 
if ( fosock [= NULL && fpfile t= NULL } 
i 
header fpsack, content); 
tprintf(fpsock, "rin"; 
while( (c = getc(fpfile) ) t= EDE ) 
putc(c, fpsock); 
fclose(fpfile); 
fclose(fpsock); 
| 


exit(0?) : 


i 


12.5.7 比较 Web 服务 器 


Web 版 务 器 允许 其 他 机 器 上 的 客户 得 到 旧 录 信息 . 读 取 文件 和 运行 程序 。 所 有 的 Web 
服务 器 都 要 完成 这 些 基 本 操作 ,并 且 必 须 遭 守 HTTP 协议 。 

邦人 么 服务 器 之 间 有 人 人 么 区 别 呢 ? 有 的 服务 器 容易 配置 和 操作 ,有 的 提供 了 更 多 的 安全 
特征 ,有 的 则 快速 处 理 请 求 或 合用 较 少 的 内 存 。 其 中 -个 重要 的 特征 是 服务 散 的 效 兴 问题 ， 
服务 器 可 以 同时 处 理 多 少 个 请 求 ” 对 于 每 个 请 求 ,服务 器 需要 老少 系统 资源 ? 

本 书 的 Web 服务 器 对 于 每 个 请 求 部 创建 新 进程 来 处 理 。 这 是 最 高 效 的 方法 吗 ? 读 取 文 
件 和 月 录 的 请 求 需要 较 长 的 时 间 , 所 以 服务 器 没有 必要 等 待 这 些 操作 完成 ,但 是 胆 必 要 用 一 
个 新 的 进程 吗 ? 

有 第 三 种 方法 可 以 同时 运行 多 个 操作 。 程序 可 以 在 一 个 进程 中 运行 多 个 任务 ,这 可 通 
过 使 用 线程 (thread) 来 实现 。 在 后 男 的 章节 中 将 学 习 它 的 使 用 。 


小 
]. 主要 内 容 
* 基于 socket 的 客户 /服务 器 程序 遵循 :个 标准 框架 。 服 务 器 接收 和 处 地 请 求 , 客 户 发 


。 服务 器 建立 服务 峰山 socket. ARS aim socket A AAAS MOE FOE HE E. 
。 客户 创建 和 使 用 客户 问 socket, FP HARK DSP socket 的 地 址 。 
* BEA RH RR EA OK: 自己 处 理 请 求 ,或 使 用 fork 创建 新 进程 来 处 
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理 请 求 。 
。 Web 服务 器 是 最 受 欢迎 的 基于 socket 的 程序 。Web 服务 器 处 理 3 种 类 型 的 请 求 ， 
返回 文件 内 容 RI RAST. FORAY SPR HTTP., 
2. FFA 
电 活 呼叫 模型 不 是 客户 和 服务 器 通信 的 惧 — 75 3X. 078 A A SEBB CF Ac A E IM TROK 03 
商品 。 使 用 基 二 消息 的 通信 系统 ,每 个 购物 者 可 以 一 次 处 理 多 个 商店 的 购物 ,而 商店 可 以 同 
时 处 理 多 个 顾客 的 请 求 。 在 下 一 章 中 ,将 学 习 使 用 明信片 模型 的 网 络 编 程 数据 报 
( Datagram) socket, 
3. J 


12:1 


在 时 间 服 务 的 例子 中 调用 了 read 和 write 一 次 。 如 果 服 务 器 端 发 送 过 来 的 数据 
分 儿 次 到 达 或 超出 缕 存 的 大 小 将 会 怎样 ? RAP oie ES H read. RM 
Ree 在 服务 器 端 ,write PRADA BH EE. KARE? 


12.2 IRAJ SIGCHLD RS Ab ZB pL EE HH. waitpid 和 -个 循环 。 那么 可 以 在 一 -个 循 
环 中 使 用 常规 的 wait 来 处 理 多 个 信号 问题 吗 ? 

4. 编程 练习 

12.3 改写 本章 中 的 一 般 服 务 司 模型 ,使 得 作 被 们 导 中 断 时 ,可 以 重 起 调用 accept. 

12.4 改写 Web 服务 器 ,使 得 它 保 留 所 有 有 请求 和 返回 状 态 的 日 志 信 息 ， 

12.5 H4 Web 服务 器 接收 CGI 程序 请 求 时 ,服务 器 将 设置 一 些 CGI 程序 的 环境 灾 量 。 
找 出 这 些 环境 变量 ,并 把 其 中 的 一 些 加 到 Web PREZ, Shell 一 章 中 解释 了 如 
何 设置 环 境 变 量 ， 

12.6 Web 服务 器 可 以 使 用 两 种 方法 来 识别 每 个 请 求 所 要 运行 的 程序 。 本 章 中 是 以 . 
ci 作为 扩展 名 来 识别 要 运行 的 程序 。 其 一 种 方法 是 使 用 路 径 。 特 别 地 ,如 果 请 
求 的 路 和 从 中 包含 有 日 录 名 egi-bin, 该 程序 就 被 运行 。 例 如 ,对 于 /cgi-binycounter 
的 请 求 在 该 系统 下 将 被 服务 器 执行 。 改 写 服 务 器 以 支持 这 种 方法 。 

12.7 改写 Web RS BEBE NT MATES ANB. pA ee T a 
头 部 项 的 集合 。 将 这 些 项 增加 到 Web IRS BEE. 

12.8 改写 Web RS 38 L4 x Hp HEAD BK. Bi HTTP 协议 获取 详细 信息， 

12.9 改写 Web 服务 器 以 支持 POST WOK. Bl HTTP 协议 获取 详细 信息 。 

5. 项 目 


基于 本 章 的 内 容 , 可 以 学 习 编 写 下 面 的 Unix 程序 ， 


httpd.trelnetd,fingerd,ftpd 
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概念 与 技巧 

， 基 于 数据 报 的 编程 ,数据 报 socket 
* TCP 与 UDP 

+ TEA) HE dE 

> 软件 时 间 惟 (Software ticket) 

© 设计 健壮 系统 

> 设计 分 布 式 系统 

^ Unix BRAY socket 

相关 的 系统 调用 与 函数 

* socket 


* sendto,recvirom 


13.1 软件 控制 


程序 的 运行 需要 内 存 .CPU 和 一 些 系统 资源 。 操 作 系统 关心 这 类 事情 ,但 是 一 些 程序 还 
需要 关心 另 一 件 事 情 : 就 是 程序 期 有 者 的 允许。 

从 合法 性 的 角度 讲 ,需要 有 一 个 许可 证 (license) 来 保证 程序 的 合法 运行 ,但 是 有 些许 可 
证 却 是 带 有 限制 的 。 例 如 ,有 的 许可 证 是 限制 同时 运行 程序 的 用 户 数 。 一 个 10 人 的 许可 证 
可 能 需要 一 定 的 花费 ,而 50 人 的 许可 证 可 能 需要 更 多 的 花费 。 有 些 厂商 租赁 软件 许可 证 , 当 
租赁 期 到 了 ,程序 就 不 能 继续 运行 。 当 然 除了 合法 性 方面 之 外 ,软件 也 还 受到 其 他 一 些 因素 
的 限制 。 学 校 里 的 计算 机 房 就 可 能 限制 每 天 游戏 程序 运行 的 次 数 。 

有 些 软件 拥有 者 使 用 碱 信 机 制 来 限制 程序 的 使 用 ,他 们 把 许可 证 条 坎 打 印 在 屏幕 上 或 
纸 上 并 要 求 用 户 遵守 协约 。 其 他 的 则 使 用 特定 的 技术 来 实施 许可 证 条 款 ， 
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一 种 实施 许可 证 技术 是 编写 穆 序 来 执行 许可 证 控制 。 通 常 的 做 法 是 设计 从 一 个 许 本 证 
服务 器 获得 许可 的 应 用 程序 。 该 服务 器 是 -个 进程 , 它 授 权 应 用 程序 的 运行 。 
许可 证 服务 器 明确 许可 证 条 款 并 且 强 制 执行 该 条 款 , 如 图 13. 1 所 示 。 





图 13. 1 许可 证 服务 器 给 于 许可 


请 求 许可 和 给 予 许 可 需要 客户 和 许可 证 服务 器 之 间 的 通信 。 

许可 证 服务 器 是 如 何 工作 的 ? 木 章 将 学 习 一 个 具体 的 客户 /服务 器 许可 证 控制 模型 。 
通过 该 模型 的 学 习 , 可 以 接触 到 另外 一 种 类 型 的 socket- :数据 报 socket, 另 外 的 一 个 地 址 
域 一 一 Unix 域 ,一 个 维持 系统 状态 的 网 络 协议, 以 及 其 他 一 些 有 关 设 计 安 全 健壮 的 客户 /上 服 
务 器 系统 的 技术 ， 





13.2 许可 证 控制 简 史 


软件 控制 技术 的 使 用 已 经 有 多 年 的 发 展 内 史 了 ，。 

在 单机 版 的 个 人 计算 机 时 代 , 对 软件 的 限制 是 靠 特 定 的 磁盘 或 由 隐匿 在 特定 磁道 上 的 
PISS. BAT AS ASE ERS il ,并且 只 有 磁盘 在 驱动 器 中 的 时 候 程 序 才能 运行 。 
如 果 磁 盘 玉 失 了 或 被 损坏 了 ,该 程序 将 不 能 再 运行 。 人 们 很 寥 就 破解 并 找到 了 如 何 来 复制 
这 种 特殊 磁盘 的 方法 ,所 以 软件 厂商 发 明了 硬件 密 钥 。 硬 件 密 钥 是 一 个 适配器 , 它 可 以 播 在 
并 口 SR HE gy USB H Es 被 许可 的 穆 序 只 有 在 发 现 该 适配器 的 时 候 才 能 运行 ， 如 果 便 件 密 
钥 于 失 , 程 序 将 不 能 运行 ， 

然而 网 络 计算 机 和 多 用 户 系 统 却 引 起 了 新 的 问题 。 如 果 10 个 用 户 同时 想 运 行 计 算 机 
或 网 络 上 的 同一 个 程序 ,那么 是 不 是 每 个 用 户 都 需要 在 服务 髓 的 端口 上 播 一 个 硬件 密 铀 
E? 软件 厂商 们 需要 一 种 可 靠 的 并 且 不 需要 给 合法 用 户 增加 额外 负担 的 方法 来 实施 许可 
证 条 款 。 

网 络 和 多 用 户 系统 提供 了 一 种 新 的 解决 方法 : 许可 证 服务 器 。 程 序 不 是 从 磁盘 或 密 外 
取得 许可 ,而 是 从 服务 器 进程 取得 。 许 可 证 服务 器 害 一 台 计 算 机 上 多 个 用 户 共 享 ARS 
程 能 够 控制 程序 的 使 用 人 数 、 使 用 时 间 、 使 用 地 点 甚至 程序 的 使 用 方式 。 伴 随 更 多 的 计算 机 
加 入 因特网 ,服务 器 控制 对 软件 和 数据 访问 的 需求 也 更 加 迫切 。 

木 章 中 的 许可 证 服务 器 将 实施 用户 的 限制 。 也 就 是 说 ,服务 器 呈 允 许 特定 数量 的 程序 
实例 同时 运行 。 
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13.3 一 个 非 计算 机 系统 实例 : BF S REIR DG 


-个 公司 购买 了 许可 证 .该 许可 证 限制 了 同时 使 用 程序 的 用 户 数 . 公司 可 能 拥有 比 圭 
可 让 所 允许 的 用 户 要 多 的 殿 员 ,但 是 并 非 所 有 的 殿 员 要 同时 使 用 程序 ， r 样 的 一 个 设计 才 
能 满足 上 面 的 需求 呢 ” 
MERA HARZ AR OB I X REA EE Ar B9 E eM deg. iux 
里 将 分 析 一 个 模型 : 案 员 共享 公司 轿车 的 问题 ， 一 个 公司 拥有 特定 数量 的 轿车 ,同时 还 拥有 有 
更 多 数量 的 明 员 ， 如何 控制 对 轿车 的 使 用 呢 ” 


13.3.1 轿车 钥匙 管理 描述 


控制 轿车 的 使 用 是 通过 控制 对 轿车 钥匙 的 访问 。 当 想 用 轿车 的 时 候 . 必 须 先 得 到 一 把 
Ak. MREAKAPRAALT ,将 不 能 使 用 轿车 。 如 果 有 可 用 钥匙 .可 以 先 拿 一 把 外 
三. 签名 ,然后 使 用 轿车 。 使 用 完毕 后 ,把 钥 悬 放 回 钥匙 盒 . 在 使 用 轿车 名 单 中 划 去 自己 的 名 
字 。 过 程 描述 如 图 13.2 所 示 。 


SEL Ame eb, HER — cmm 





13.2. 控制 对 轿车 的 的 使 用 


PEPENE a 该 系统 的 目的 是 通过 控制 对 轿车 的 使 用 ,使 得 可 用 的 钥匙 一 直 
很 充 是 。 人 并 非 是 完美 的 .有 时 司机 会 忘记 归还 钥匙 。 钥 是 管理 员 可 以 根据 繁 名 列表 找到 
该 司机 ,确定 Nike 使 用 车 。 

轿车 使 用 管 PRSE dE 制 软件 使 用 的 一 个 现实 模型 。 在 将 该 系统 转 热 成 软件 系统 之 
Hil ， EA VEA 

1126 系统 的 构成 如 下 : 

(1) plete ood — BI) BB JL BY LL £3 $A ae 

(2) 钥 是 管理 员 一 一 执行 策略 的 人 

(3) 钥匙 一 一 需要 得 到 的 东西 

(4) 签名 列表 一 一 保存 钥匙 和 和 找 回 诅 匙 的 记录 


13.3.2 用 客户 /服务 器 方式 管理 轿车 


在 给 出 轿车 钥 是 管理 系统 的 构成 后 ,下 面 将 用 客户 /服务 器 语言 来 描述 该 系统 ， 
C1) 服务 器 和 客户 
准 是 服务 器 和 淮 是 客户 ? 钥 是 管理 员 拥 有 司机 需要 的 钥匙 。 用 网 络 术 语 来 描述 .钥匙 
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a moo n m a m Ps 二 


管理 员 是 服务 器 ,司机 是 客户 。 


(2) 协议 
AHARIA? EWEEK EA? 锋 车 钥匙 管 理 协议 包括 两 个 主要 的 可 务 。 
。 RG A 


客户 ; 你 好 ,我 需要 一 把 钥匙 。 

和 服务器; IX BEIDE. WORST. 

。 归还 钥匙 

客户 : 我 已 经 用 好 5 SAA. 

服务 器 : 谢谢 。 

(3) 通信 系统 

客户 和 服务 器 旭 何 通信 ? 在 该 系统 中 ,人 人 们 通过 对 活 来 传递 简单 信息 。 

(4) 数据 结构 

梧 机 和 锁匙 管理 员 需 要 什么 样 的 数据 结构 电 ? 钥匙 管理 员 保 留 一 个 败 户 签名 列表 ,一 
把 钥匙 对 应 列表 的 一 项 。 当 -- 个 用 户 取 走 一 把 铀 是 ,钥匙 管理 员 在 该 项 记 下 用 户 的 名 字 , 妆 
Ri PH EHREBT :管理 员 把 本 机 的 名 字 从 列表 中 所 去 。 下 表 解 释 了 用 户 签名 列表 : 


签名 列表 


33 | 
uu 
X 


司 机 


adam(2 sales 


carol(& support 


Po Ww a 


ASR EE A R H RA DUES Hh ABBA LEAR. 反之 ,表示 不 可 用 ， 


13.4 许可 证 管理 


本 市 将 钥 古 管理 系统 的 思想 运用 到 许可 证 管理 系统 中 。 
13.4.1 许可 证 服务 系统 : 它 做 些 什么 


图 13.3 描述 了 人 人 们 试图 运行 许可 证 程序 的 计 程 。 工 作 如 下 : 
(D. ALP U 运行 镁 许可 的 程序 P; 

(2) HIY Pisa S 请 求 运 行 许可 ; 

(3) 服务 器 检查 当前 运行 程序 PP 的 用 户 数 ; 

(4) 姐 果 上 限 末 达到 ,SS 给予 许可 ,程序 已 运行 ; 

(5) Rik) EBB,S 拒绝 许可 ,程序 PP 上 告诉 U 稍 后 再 试 。 
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z 小 用 户 ut veu pg iF Gf ERE S es 


üp 





Socket 


图 ]3.3 Jf ferm A 


许可 证 服务 系统 与 轿车 钥匙 服务 系统 稍 有 不 同 。 在 轿车 系统 中 .司机 回 钥 是 管理 员 请 
求 许可 ; 而 在 这 里 ,程序 回 服务 吕 请 求 许 可 。 这 就 像 司 机 请 求生 车 ,而 锋 车 向 钥 古 管理 员 请 
AR PARES 

程序 的 创建 者 要 编 与 所 有 的 程序 : 应 用 程序 和 服务 器。 这 两 个 程序 作为 一 个 系统 。 服 
荔 嚣 绽 也 应 用 程序 运行 纤 可 和 实施 许可 证 条 蒜 。 如 困 许 可 证 服务 器 不 在 运行 ,应 用 程序 将 
得 不 到 评 可 .不 能 运行 。 

这 里 以 辆 车 钥匙 服务 系统 作为 模型 进行 了 讨论 。 那 么 如 何 将 这 种 思想 这 用 到 软件 系统 
ceo 被 许可 程序 如 何 从 服务 器 得 到 许可 ? 服务 器 如 何 给 子 许 可 ? £X (EF Z5 EU BTE B RC RK 
统 的 等 价 之 处 在 哪里 呢 * 


13.4.2 许可 证 服务 系统 : 如 何 工 作 


(1) 票据 模型 

角 古 管理 员 负 责 分 发 铀 浊 , 许 可 证 服务 此 发 布什 么 呢 ? 以 电影 院 和 棒球 场 为 例 . 付 钱 获 
£5 EE VE ol SA TE BI — SKA Dot ie. e EMA xx 的 许可 证 服务 从 发 个 l9 hc 3 51» Se 
这 种 票据 又 是 什么 样子 的 呢 ? A MRK BS EES mu SHES ROOF 


pid. ticketnumber {Fi} ul: 6589, 3 


SESK SME RANA SEM PID ELE SR dB. EMEP ae PID 的 原因 其 实 就 
和 在 飞机 票 上 印 上 名 字 的 道理 是 一 样 的 。 票据 中 的 PID 标识 票据 的 使 用 者 ,在 票据 丢失 时 ， 
可 以 锅 助 找 回音 据 。 进 程 可 能 亚 失 票据 吗 ”? 

(2) 服务 站 和 客户 

淮 起 客户 和 谁 是 服务 器 ”许可 证 服务 宫 尘 有 程序 需要 的 资源 : WU. BRA A. SI 
证 服务 器 是 服务 器 .而 应 用 穆 序 是 客户 ， 

(3) 协议 

协议 是 什么 7 交互 的 事务 是 什么 ? 这 里 的 坚 据 管理 协议 包括 下 面 的 两 个 主要 惠 务 : 


这 个 概 人 并 布 礁 理解 ， 随 着 设备 越 来 越 先进 .连接 战 来 上 越 方便 ,很 可 能 在 不 久 的 将 来 就 可 以 通过 你 的 收音 析 淘 癌 
服务 器 是 否 有 播放 你 最 总 欢 歌 由 的 许可 ， 


a JRG u Unix/Linux £g ££ 3 B UR 


e TKIP 

客户 ， HELO mypid 

服务 器 : TICK ticketid or FAIL no tickets 

© iih slit 

AP: GBYE ticketid 

服务 器 ; THNX message 

这 里 定义 了 基于 交 人 本 的 协议 ,协议 中 使 用 了 六 4 个 字符 的 简单 命令 ,这 与 前 面 的 Web 服务 
ae PT FAS at > FE AL. 

CAD 通信 系统 

上 述 简短 的 文本 信息 如 何在 客户 和 服务 器 之 间 传送 ”在 本 文 后 面 将 讨论 该 问题 。 

GO HESS SJ 

客户 和 服务 器 之 问 所 用 的 数据 钻 构 是 什么 ?这 里 使 用 整 型 数组 作为 签名 列表 。 数 组 的 
ae} A UK She. SR PRE TKR. BO ee ey PID 写 到 该 入 口 。 
WFE: 


签名 列表 
“i mM 
RN 1 1234 
t) 
3 6589 
4 f) 


如 果 数 组 中 的 某 个 元 素 值 是 和, 表明 该 票据 可 用 。 合 则 ,表明 该 村 朱 正在 被 合用。 
13.4.3 一 个 通信 系统 的 例子 


A) MARE? 和 服 务 器 如 和 何 发 布 票据 ”这 涉及 到 进程 间 的 通信 彤 式 。 窗 户 和 服务 
器 之 隔 通 过 知 消 县 通信 。 上 服务 只 必须 接收 ,处 理 和 上 应答 米 自 多 个 客户 的 请 求 。 目 前 ,哪些 技 
术 征 可 以 使 用 的 呢 ? 本 文 表 面 池 习 的 优 续 和 管道 机 制 可 以 考虑 ,位 是 信号 太 短 了 ,而 管道 只 
连接 相关 联 的 进程 。 所 以 ,使 用 socket 是 最 明显 的 答案 。 而 对 于 socket, 也 有 两 种 木 同 的 选 
B. -种 是 基于 流 的 socket; 它 是 用 来 连接 不 相关 的 进程 的 。 另 一 种 socket 被 称 为 数据 报 
socket, AKA UDP, 对 于 现在 的 项 日 ,这 种 socket 是 更 好 的 选择 


13.5 数据 报 socket 


iit socket 传送 数据 就 距 电 话 网 中 传送 声音 一 样 ,客户 先 建 立 连接 ,然后 使 用 该 连接 进行 
单亲 , 双 朵 或 类 似 管道 的 字 节 流传 送 。 

数据 报 遂 伯 则 与 从 一 个 邮箱 到 另 -个 邮箱 发 送 包 衷 类似。 客户 不 必 建 立 连 接 , 只 要 向 
特定 的 地 址 发 送 消息 ,而 服务 器 进程 在 该 地 址 接收 消息 。 


一 一 一 一 一 一 -一 -一 一 一 一 一 一 一 一 一 一 -一 一 一 一 一 


第 13 章 基于 数据 报 (Daragram) 的 编程 : 号 许可 证 服务 器 + 387 : 











流 socket 使 用 的 网 络 协议 叫 TCP 即 传 输 控 制 协 以 (Transmission Control Protocol), 
数据 报 socket 叫 UDP 即 用 户 数据 报 协 议 (User Datagram Protocol)。 它 们 的 区 别 是 什么 
呢 ? fol af oe FE fol AP socket 是 较 好 的 呢 ? 在 程序 中 如 何 使 用 数据 报 socket WE? 


13.5.1 流 与 数据 报 的 比较 


socket 是 如 何 工作 的 ? 数据 如 何在 Internet 上 传输 的 ” 当 用 户 向 流 socket 与 数据 时 ,内 
核 要 做 些 什么 ? 这 与 向 数据 报 socket 写 数 据 有 何 区 别 ? 
从 一 个 流 socket 传输 到 另 一 个 流 socket 的 数据 流 ,看 上 去 是 连续 的 、 无 颖 的 ,实际 上 这 
一 种 错觉 。Internet 连接 要 把 数据 分 割 成 独立 的 数据 包 。 网 络 数 据 传 输 过 程 如 图 13. 4 
BI. 





fA 13.4 Internet £1 f£ 42 8 1E 


在 现实 世界 中 ,有 很 多 将 一 大 块 数据 分 割 忒 若干 较 小 的 数据 块 的 例子 . 假设 要 通过 快 
递 传 送 100 页 的 文档 。 当 快递 公司 要 求 你 使 用 只 能 装 20 页 的 信封 时 ,该 怎么 办 ”可 以 把 文 
档 分 割 成 5 个 包 圳 ,每 个 单独 地 打包 和 酝 上 人 地址 。 然 后 把 这 5 个 独立 的 包 右 放 到 邮箱 中 , 运 
.和 输 系 统 将 负责 把 它们 送 到 目的 地 在 接收 端 ,接受 者 打开 这 5 个 包 训 ,并 把 它们 按 顺 序 重组 
成 原来 的 文档 。 

Internet 就 像 上 述 运 输 系 统一 样 , 它 上 面 传输 的 数据 必须 符合 大 小 的 眼 制 。 大 块 的 数据 
被 分 割 成 小 尖 的 数据 来 传输 ,接收 并 必 须 以 正确 的 顺 座 重组 数据 块 。 但 通信 过 程 可 以 被 连 
荡 和 中 断 , 如 图 13.5 所 示 ， 








13.5 通信 可 以 被 连接 和 中 断 


流 socket 负责 分 害 .排序 .重组 的 所 有 工作 。 数 据 报 socke MAS, FRBEWTEMNZ 
全 的 区 别 。 
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TCP UDP 

流 数据 报 ——————Á——— 
分 片 重组 8 

Hey: f 

n] as "T BE AR $03 

UM 多 个 发 送 者 


在 流 socket 中 ,内 核 将 大 的 数据 块 分 割 成 再 纺 号 的 数据 片 。 位 于 接收 机 夷 鞋 的 内 核 按 
顺序 接收 数据 片 , 午 组 成 发 送 者 所 发 送 的 原始 数据 。 和 在 数据 报 socket 中 ,内核 并 不 给 数据 加 
缠 号 标签 ,在 目的 地 也 不 重组 。 | 

Mt socket 对 传送 负责 ,数据 报 socket 则 不 。 流 socket B5 PE Mc m Fr e Bee Fr B ML AER 
保 数 据 完整 到 村。 接收 端 提 水 发 送 问 丢失 的 数据 片 的 编号 ,并 等 等于 失 数据 片 的 重 传 ， 数 
WIR socket IF PMA RRR Rus ERE Em. Gn EP e) E A Internet PEAR RE 
Bik, TCP E UDP 做 更 多 的 工作 。UPP 更 快 . 更 简单 ,给 网 络 较 少 的 负荷 。 

UDP 接收 消息 跟 邮箱 系统 方式 相同 : 发 送 者 将 你 的 地 址 写 在 信件 上 ,邮件 系统 负责 将 
信件 送 到 你 的 邮箱 中 ,然后 你 从 邮箱 中 取出 信 。TCP socket 需要 明确 调用 accept. read All 
close 来 读 取 远 端 进程 的 消息 。 

UDP 在 好 适合 这 里 的 应 用 。 客 户 发 送 短 消息 来 获得 许可 ,服务 絮 发 送 短 消息 给 予 或 拒 
it. PAIRS Ne Ai EER. Ae RA Ra. CMR ERAS. 
如 果 请 求 或 票据 备 失 ,客户 可 以 再 次 请 求 。 在 任何 事件 中 ,服务 器 和 客户 就 像 人 在 一 台 租 器 上 上 
或 者 -一 个 网 络 的 问 一 部 分 ,所 以 丢失 数据 报 的 风险 较 小 。 

UDP 对 于 Web IKA 3881 e-mail 服务 是 -… 个 较 差 的 选择 。Web 服务 器 和 e-mail 信息 可 
能 是 大 的 文件 ,这些 字 YS Bii ELSE =e ASR BIA H BUM... UDP 对 于 允许 丢失 帧 的 声音 种 视 


13.5.2 RAE 


数据 报 与 邮件 网 络 系统 类 似 , 包 括 3 个 主要 部 分 ; 目的 地 址 ,返回 地 址 和 消息 ,如 图 13.6 
BT. 





| sender | destination | data | 


lz] 13.6 数据 报 的 3 部 分 





ATE socket 可 以 被 理解 成 -个 内 部 有 数据 的 盒子 ,发送 者 给 出 日 的 socket 的 地 址 。 
网 络 将 数据 从 发 送 者 发 送 到 日 的 socket。 接 收 进程 从 该 socket 中 读 取 数据 。 程序 使 用 
sendto 发 送 数 据 和 rccvfrom 来 读 取 数据 ,如 图 13.7 Beas. 
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一 台 主 机 可 能 有 多 个 接收 socket, H+ socket B f K 9 
一 个 等 定 的 端口 号 。 地 址 用 主机 上 的 端口 来 区 分 。 


图 13.7 使 用 sendito RI recvírom 


1， 接 收 数 据 报 
程序 dgrecv. c 是 一 个 简单 的 基于 数据 报 的 服务 器 ，dgrecv. c 使 用 命令 行 传 过 来 的 端口 
号 建立 socket ,然后 进入 循环 ,接收 和 打印 从 客户 端 发 来 的 数据 报 : 


[ne A a Re Oe OR Ye np Xe ee eK MM X MX KN Xx M x X k 


* dgrecv.c - datagram receiver 


y 
%4 


*/ 


# include 
# include 
+ include 
R include 


H include 


usage; dgrecv portnum 


action, listens at the specfied port and reports messages 


«stdio. h> 

« stdlib. h> 

« sys/types. h> 
< sys/ socket. h> 
<netinet/in. h> 


B define oops(m,x) ( perror(m) ;exit(x) >} 


int make_dgram_gerver_gocket(int); 


int get internet address(char * , int, int * , struct sockaddr in * ); 
void say who called(struct sockaddr in x»); 


int main(int ac, char x av[ }) 


{ 


int port; /* use this port */ 

int sock, /* for this socket «/ 

char buff BUFSIZ |; /* to receive data here x/ 

size t msglen: /* store its length here «/ 
struct sockaddr in saddr; /x put sender's address here */ 
Socklen t saddrien; /* and its length here «/ 

if (ac == 1 {| (port = atoi(av[11)) <= 0 )t 


fprintf(stderr, “usage; dgrecv portnumberXn") ; 
exit(1); 
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/* get a socket and assign it a-port number */ 


iff (sock = make dgram server socket(port)?) == -1) 


oops( "cannot make socket", 2) - 
/* receive messaages on that socket x/ 


saddrlen = sizeof(saddr} ; 


while( (msglen = recvfrom(sock,buf,BUFSIZ,0,&saddr,&saddrlen)2 7-0 3 


buf[msglen| = '\Q'; 
printt( “dgrecy, got a message: * sin", buf): 
say who called(&saddr); 


1 


return (: 


void say who called(struct sockaddr in * addrp? 


| 
char host[ BUPSIZ.; 


int port: 


get internet address(host,BUPFSÍZ,&port addrp) ; 


printf(" from; $5, $ din", host, port): 


辅助 图 数 make dgram server socket 和 get internet address J£ Je Mz E AYP dgram. c 
中 定义 。 在 数据 报 socket 中 接收 消息 比 从 流 socket 接收 简单 。recvirom pa PE E EIER d 
到 达 。 当 数据 报到 达 时 ,消息 内 容 . 返 凸 地 考 和 其 长 度 将 被 复制 到 缓存 中 。 

2, 发 送 数据 报 

程序 dgsend.c AIK SHER. dgsend.c 创建 一 个 socket, 然 后 用 它 发 送 消 息 虽 以 命令 行 
参数 传 入 的 特定 的 主机 和 端口 号 ， 


JO Ox Rok MOX OX KOX XX Ox x geo X Eee oX* X X X XX Ko X X X OX Xo X X Go X X X oGXXOX Xo oX GC WoWX X oXS o 4o * X oXoX koX oxXoxX 


* dgsend.c datagram sender 


* usage, dgsend hostname portnum "message" 
* action: sends message to hostname; portnum 
其 地 


# include  «stdio.h-» 

4 include < stdlib. hz 

4 inciude <Osys/types. hi» 
# include  -sys/socket. hl 


# include  «znetinet/in, hz 


# define oops(m,x) i perror(m);exitix):;;: 
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int make dgram client socket(); 
int make internet address(char * ,int, struct sockaddr in * 95; 


int main(int ac, char x av[ ]) 
I 
t, 


int sock: /* use this socket to send x/ 
char * Msg; /* send this messag */ 
struct  sockaddr in  saddr; /* put sender's address here x/ 


if (ac ! * 4)i 
fprintf(stderr, "usage; dgsend host port 'message'’\n"); 
exit(1); 

! 

msg = av! 3]; 


/* get a datagram socket x/ 


if( (sock = make dgram client socket()) == 一 1) 


oops( "cannot make socket", 2); 
/* combine hostname and portnumber of destination into an address x/ 
make internet address(av|l], atoi(av[2]), &saddr) 
/* send a string through the socket to that address #/ 


if € sendto(sock, msg, strlen(msg), 0, &saddr,sizeof(sadür)) =~ ~ 1) 
oopst "sendto failed", 3); 


return 0; 


sendto PR UA 2 FF FAY AAS AK Sl ee AE AY socket, 
3. $8 Eu KK 
创建 socket 和 socket 地 址 的 细节 被 封装 在 dgram. c 中 ， 
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ee ee ee ee ee ee EX 


* dgram.c 


* support functions for datagram based programs 


xj 


# include <stdio.h> 

# include  -—unistd. h> 

守 include <sys/types.h> 
iinclude < sys/ socket. h> 
# include  «netinet/in.h — 
# include  «arpa/inet. h> 
H include < netdb. h> 

i include «string. h> 


H} define  HOSTLEN 256 


me 
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int make internet address): 


int make dgram server socket(int portnum) 


| 


struct  sockaddr in saddr; /* build our address here «/ 
char hostname| HOSTLEN|; /* address x/ 
irit Sock id; /* the socket */ 


SOck id = socket(PF INET, SOCK DGRAM, 0}; /x get a socket +/ 


if ( sock id == -1) return - 1; 
/** build address and bind it to socket «x / 


gethostname(hostname, HOSTLEN) ; /* where am I ? x/ 
make internet address(hostname, portnum, &saddr); 


if( bind(sock id (struct sockaddr * )&saddr, sizeof(saddr)) |= 0) 


return - l; 


return sock id; 
D 
int make, dgram client socket() 
í 
return socket(PF INET, SOCK DGRAM, 0); 
; 


int make internet address(char * hostname, int port, struct sockaddr in * addrp) 
/* 
* constructor for an Internet socket address, uses hostname and port 
* (host,port) - > * addrp 
x/ 
| 
struct hostent »* hp: 


bzerot(void x )acddrp, sizeof(struct sockaddr, in)?); 

hp = gethostbyname(hostname); 

if € hp == NULL) return - 1i; 

bcopy((void * hp- >h addr, (void * )&addrp- >sin_addr, hp- —h length); 
addrp- sin port = htons(port); 

addrp- 7 sin family = AF INET; 

return 0; 


} 


int get internet address(char * host, int len, int x portp, struct sockaddr in * addrp) 
iM 
* extracts host and port from an internet socket address 
+x addrp — > (host, port) 
x / 
i 
strncpy(host, inet ntoa(addrp ~ 7sin addr), len); 
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im 


* partp = ntohs(addrp- 7-sin port); 
return Q; 


| 


创建 一 个 数据 报 socket 与 创建 一 个 流 socket 类 似 。 其 不 同 点 在 于 ,这 里 设置 socket 的 
类 型 为 SOCK DGRAM. 而且 不 要 调用 listen iR 

4. 编译 和 测试 

$ cc dgrecv.c dgram.c - o dgrecv 

à ./dgrecv d4dd4 & 

[1] 19383 

$ cc dgsend.c dgram.c ~ o desend 

S ./dgsend host2 4444 "testing 123" 

dgrecv,got a message: testing 123 

from,10. 200.75. 200.1041 

$ Ps 

PID TIY TIME CMD 

14599 pts/3 00,00,00 bash 

19383 pts/3 00,00,00 dgrecv 

19393 pts/3 00;00.00 ps 

$ 


编译 服务 器 ,并 启动 它 , 使 得 它 监听 在 端口 4444。 然 后 编译 和 运行 客户 ,使 客户 发 送 字 
符 串 到 端口 4444。 服 务 器 接收 消息 ,打印 消息 ,并 且 打 印 消息 的 返回 地 址 。 客 户 socket 拥有 
主机 地 址 和 端口 号 ,内 核 随机 地 给 它 分 配 了 -- 个 端口 号 1041. ps 进程 显示 了 服务 器 正在 
运行 。 


13.5.3 sendto 和 recvfrom 的 小 结 





sendto 
目标 从 socket X 5 iH &. 
X cxt H include e sys/types. h> 
H include «sys/socket. hi 
E dec um a nchars = sendie(int socket, const void * msg, size_t len, int flags, const struct 
sockaddr * dest,socklen_1 dest len); 
参数 socket socket id 
msg 点 送 的 字符 类 型 的 数组 
len 发 送 的 字符 数 
flags 比特 的 集合 ,设置 发 送 属 性 ,0 表示 普通 
dest Js [n] au socket 地 址 的 指针 
dest len Hü hb BE 
KEH E Bat is 


nchars ”发 送 的 字符 数 


Cr 


EE 





ee 
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sendto 从 源 socket 发 送 数 据 报到 日 的 socket。 前 3 个 参数 与 write 的 参数 类 似 : BAK 
的 socket .保存 要 发 送 字符 串 的 数组 以 及 发 送 的 字符 数 。 与 write 类 似 ,sendto 返回 实际 发 
BAIS AE RK. flags fU AA GK A TE: 具体 可 参见 Unix 版 本 的 帮助 信息 。 T a Bi 
个 参数 给 出 发 送 号 的 地 的 socket 地 址 。 如 果 是 Internet 类 型 的 地 址 ,socket 地 址 包含 目的 主 
机 的 IP 地 址 和 端口 号 ,而 其 他 类 型 的 地 址 则 包含 其 他 的 成 员 。 











recvfrom 
H f 从 socket EE TÉ ER 
3X x dt E include c sys/types, h27 
P include <lsys/socket. hh 
A Si a nchars = recvíromtint socket. const void * msg, size. tlen, int flags, const struct 
soekaddr * sender,socklen t » sender len); 
3 gu socket socket id 
msg 字符 类 型 的 数组 
Jen 接收 的 字符 数 
flags 表示 接收 属性 的 比特 的 集合 ,0 表示 普通 


sender fH [5] ug socket 的 地 址 的 指针 
sender len — Wi hb E RE 

返回 值 -—1 8888 
nchars 接收 的 字符 数 


reevirom 从 socket 读 取 数据 报 。 前 3 个 参数 与 read 类似， 所 要 读 取 的 socket, TE AE 
符 的 数组 以 及 要 读 取 的 字符 数 。 与 read 类 似 ,reevfrom 返回 实际 接收 的 字符 数 。flags 48 (B 
了 接收 时 所 用 的 各 种 属性 ; 具体 可 参见 Unix 系统 的 帮助 信息 。 通 过 最 后 两 个 参数 ,可 以 获 
得 发 送 者 的 地 址 。 发 送 socket 的 地 址 将 被 存放 在 由 第 一 个 参数 指向 的 结构 中 ,地 址 长 度 存 
BOE BP Bata RAMP. KR ee ee recv[rom AM; 如 果实 际 的 地 
PRAM ERE. ERE RIA. MRA-TSBRHAASA. REA MELA SIE. 


13.5.4 数据 报应 答 

程序 dgsend. c 和 dgrecv. c 显示 了 了 如何 从 客户 发 送 数 据 给 服务 器 。 服 务 器 如 何 给 客户 
AGANT 在 现实 志 界 中 ,假设 有 人 给 你 发 送 了 一 封 晚 宣 的 洲 请 肾 , 你 将 如 何 给 员 答 复 呢 ? 
这 很 简单 : 你 只 要 纵 洲 请 鲨 上 的 返回 地 址 同 信 和 就行 了 ， 

程序 dgrecv2.c M Pbi BHR RIAA AWS 


ee XXX EUX X GE ee ee ee ee ee ee ee ee ee ee ee XO EX X 


+ dgrecv2.c — datagram receiver 


* usage. dgrecv portnum 
x action; receives messages, prints them, sends reply 
uf 


iinclude <stdia. h> 


H include <I stdlib. ho 
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HK include <Uunistd. h> 


" 


d include  — string. hlc 
#4 include <sys/types.h> 


A 


Ë include  -2sys/socket.h-- 


H include  «netinet/in.h- 
4 define cops(m,x) i perror(m ;exit(x);} 


int make dgram server socketí(int); 
int get internet address(char' ,int, int’ struct sockaddr in"); 
void say who calied(struct sockaddr in x ); 


void reply to sender(int,char # ,struct sockaddr in * , socklen t); 


int main(int ac, char «av, |) 


| 


int port; /* use this port s/ 

int sock; /* for this socket »/ 

char buf| BUFSIZ |; /* to receive data here */ 

size t msqlen; {x store its length here «/ 
struct sockaddr in saddr; /* put sender?s address here +/ 
Socklen t saddrlen; /* and its length here «/ 

if (ac == 1 || Cpert = atoifavl 10? <= 034 


fprintf(stderr, “usage; dgrecv portnumber\n") ; 


exit(1); 


/* get a socket and assiqn it a port number x/ 


ift (sock = make dgram server socket(port)) == -1) 


oops( "cannot make socket", 2); 
/* receive messaages on that socket «/ 


saddrlen = sizeof(saddr): 
while( (msglen = recvfrom(sock, buf ,BUFSIZ,0, &saddr,&saddrlen)).-0 ) { 
buf; msglen] = 'X0'; 
printf("dqgrecv, got a message. * sin", buf); 
say who called(&saddr); 
reply to senderísock,buf,&satdr | saddrlen): 
: 
return 0; 
void reply to sender(int sock,char » msg,struct sockaddr, in * addrp,socklen t len) 


{ 
char reply| RUFSIZ + BUFSIZ]; 


sprintfí(reply, "Thanks for your *d char message\n", strlen(msq)); 
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eT h lie om 


sendto(sock, reply, strlen(reply), 0, addrp, len); 
I 
void say who called(struct sockaddr in x addrp? 
| 
char host| BUFSIZ ] ; 
int port; 
get internet address(host,BUFSiZ,&port addrp?; 
printf(" from. $s, *d\n", host, port); 


发 送 者 程序 当然 也 要 改变 以 接收 应 答 。 这 作为 练习 由 读者 来 完成 。 
13.5.5 数据 报 小 结 


数据 报 是 从 一 个 socket 发 送 到 为 一 个 的 短 消 且 。 发 送 者 使 用 sendto 来 指定 消息 KE 
和 目的 地 。 接 收 者 使 用 recvfrom Hey. RRR AAT Ay Heb AY Internet 上 传输 的 数据 包 
的 基本 结构 接近 . 因此 ,数据 报 给 内 核 网 络 切 能 和 网 络 流量 增加 的 负荷 较 少 。 由 于 数据 报 
可 能 在 传输 中 丢失 ,也 有 可 能 不 按 顺 序 地 到 达 ,所 以 它 通 常用 对 简单 和 高 效 的 要 求 比 完整 性 
和 一 致 性 更 为 重要 的 应 用 中 。 

eee TT Fe fsj LETT S, eR E FT" HR OR Qh EE A HEA Az 
送 请 求 , 所 以 数据 报 是 一 个 合适 的 选择 。 


13.6 许可 证 服务 毅 版 本 1.0 


下 面 , 回 到 许可 证 服务 器 项 目 上 来 。 这 里 的 服务 占 限 制 了 程序 同时 运行 的 实例 数 昌 。 
当 用 户 要 运行 爱 限制 的 程序 时 ,该 进程 要 同 服务 器 请 求 运行 许可 。 

如 果 并 没有 很 多 人 正在 用 该 程序 ,服务 器 发 送 票 据 给 进程 ,给予 许可 证 。 如 果 达 到 了 了 顾 
大 的 程序 实例 数 ,服务 呆 发 送 无 可 用 票据 的 消息 给 客户 ,并 旦 通知 客户 稍 后 再 试 或 者 购买 支 
持 更 多 用 户 版 本 的 软件 。 被 许可 程序 和 服务 器 之 间 通 过 数据 报 来 通信 

客户 和 服务 句 的 运行 流程 及 其 交 芋 过 程 刘 下 ， 


cini sry 








pct tick 
do your 


wait for RO 
recv RO 
proc RO 
reply to RO 












work 
tel tick 
exit 






客户 和 服务 器 分 别 由 两 个 文件 组 成 : 得 的 文件 包含 main BR KARAS SHE 
PRA. 下面 将 分 析 客 户 和 服务 器 程序 。 
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13.6.1 客户 端 版 本 1 


feo db GEO NEHER KKK EKER KH K ETRE KEE EKER AH MEX EEUU EUER IEEE EH 
x leinti.c 

+ License server client version 1 

x link with lclnt funcsl.o dgram.o 

x / 


# include 一 stdio, h> 


int main(int ac, char x* av |) 
{ 
setup():; 
if (get ticket() 1= 0) 
exit(05; 


do regular workí); 


release ticket(); 


shut_down() ; 


了 
* do regular work the main work of the application goes here 
x / 
do regular workí) 
{ 
printf("SuperSleep version 1.0 Running - Licensed Software\n") ; 


sleep(10). /* our patented sleep algorithm */ 


客户 端的 最 上 层 代 码 遵照 了 上 一 节 中 所 小 结 的 原则 。 客 户 得 到 票据 ,进行 处 理 , 释 放 票 
据 , 然 后 退出 。 该 许可 证 例 程 是 Unix sleep 程序 的 特殊 版 本 , 若 不 满意 标准 sleep 版 本 的 
工作 ,也 可 以 购买 许可 证 来 使 用 此 版 本 的 程序 。 当 然 还 要 运行 许可 证 服务 器 ,否则 该 sleep 
程序 将 拒绝 运行 。 其 中 辅助 明 数 在 lclnt_funcsl.c 中 ， 


ee ee ee ee ee ee ee ee ee XXE XE XOU Re e XE GXG 
# leint_funcst.c; functions for the client of the license server 


*/ 


i include 一 Stdio.h 

# include «sys/types.h7 
# include <‘sys/socket. h> 
# include < netinet, in. h> 
# include <netdb. h> 


ae mA dis 9o Roa to Mr rm or mon mr 一 一 一 一 一 一 一 一 -一 


= 398 « Unix/Linux 编程 实践 教程 


mm 


x * 


* Important variables used throughout 


x / 
static int pid = -1; /* Our PID «/ 
static int sd = - 1; /* Our communications socket +, 
static struct sockaddr serv addr; /* Server address x/ 
static socklen t serv alen; /* length of address */ 
static char ticket buf[128]; /* Buffer to hold our ticket »/ 
static have ticket = 9; /* Set when we have a ticket */ 
it define HSGLEN 128 /* Size of our datagrams x/ 
# define SERVER PORTNUM 2020 /* Our server's port number */ 
4 define HOSTLEN 512 


4 define oops(p) i perror(p); exit(1)0 ; | 
char * do transaction(); 


jx 
* setup; get pid, socket, and address of license server 
* IN no args 
* RET nothing, dies on errar 
* notes; assumes server is on same host as client 
xf 
setupí ) 
| 
char hostname[ BUFSIZ | ; 


pid = getpid(); /* for ticks and msgs «/ 
sd = make dgram client socket(); /* to talk to server x/ 
if ( sd == -1) 


cops( "Cannot create socket"): 
gethostname(hostname, HOSTT.FN} ; /* server on same host «/ 
make internet address(hostname, SERVER PORTNUM, &serv addr); 


serv alen = sizeof(serv_addr); 


shut down() 
close(sd); 
PRR RM E OXON MERE RK EM RR REM HERE EX EXER OUX XX XXX XR RHEE X XX 
* get ticket 
* get a Licket from the license server 
x Results; 0 for success, - 1 for failure 
其 了 


int get ticket() 
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char * response; 


char buf| MSGLEN :. 


if(have ticket) /* don't be greedy */ 


return(0): 
sprintf(buf, "HELO 出 Ga pid); /* compose request */ 


if ( (response = do transaction(buf)) == NULL ) 


return( — 1); 


/* parse the response and see if we got a ticket. 
* on success, the message is; TICK ticket 一 string 


* on failure, the message is; FAIL failure - msg 


i 


*/ 

if ( strnemp(response, "TICK", 4) == 0 ){ 
strepy(ticket buf, response + 5); /* grab Licket - id x/ 
have ticket = 1; /* set this flag +/ 


. narrate( "got ticket", ticket buf): 


return(0). 


if ( strnempíresponsc, FAIL",45 == 0) 
narrate( "Could not get ticket",response); 
else 


narrate( "Unknown message:", response) ; 


F 


return( — 1); 


| /* get ticket »/ 


fX e EO OOX NOR XXX RHE OH XX EMER X X X GO X Ce Xe X€ X XX X Ge Xo cOMO C X OX X 0 O3X* do AREAN x X Xx X EH 
x release ticket 

* Give a ticket back ro the server 

* Results, 0 for success, ~ 1 for failure 

x/ 

int release ticket() 

i 

char buf] MSGLEN | ; 


char * response; 


if(! have ticket) /* don't have a ticket x/ 
return(Q) - f* nothing to release x/ 
sprintf(buf, "GCBYE * s", ticket buf); /* compose message x/ 


if ( (response = do transaction(bu()) == NULL) 


return( - 1); 


/* examine response 
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x success: THNX info string 

# failure; FAIL error - string 

x, 

if ( strncmpíresponse, "THNX", 4) == 0 )4 
narrate "released ticket OK", ""); 
return Q; 

i 

if ( strnomp(response, "FAIL", 4) == 0) 


narrate( "release failed", response t 5); 


t 
else 
narrate( "Unknown message:", response); 


rcturn( - 1); 


| /* release ticket «/ 


JW OR ONUOROEOXOXOX XXL UXN REAR X0X* X OX Xo X OX OX X Go £X X €*X Wo Xo X X X€ X X Xo 3X* x X XX X oxXox Xx ox 


* do transaction 

x Send & request to the server ard get a response back 

x IN msg p message to send 

* Results, pointer to message string, or NULL for error 

- NOTE, pointer returned is to static storage 
* overwritten by each successive call. 

x note, tor extra security, compare retaddr to serv_addr (why?) 


P 


char x do transaction(char * msg) 


| 


static char buf| MSGLEN ] ; 
struct sockaddr retaddr; 
socklen t addrlen = sizeof(retaddr).; 


int ret; 


ret = sendto(sd, msg, strien(msg), 0, &serv addr, serv alen); 
if ( tet —— =I Ji 
Syserr( "sendto"); 
return( NULL) ; 
} 
/* Get the response back «/ 
ret = recvfrom(sd, buf, MSGLEN, 0, &retaddr, &addrlen); 
if ( ret == -1) 
syserr("recvfrom") - 


returni NULL) ; 


/* Now return the message itself «/ 


returni(buf); 
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i /x do transaction */ 


ÁOX* XX XO XM OXCXOUANOAUXONUOOEOXOÓROEUX EU EURO ROUEN RRR EMER KKK RMR X 
x narrate: print messages to stderr for debugging and demo purposes 
x INmsgl, msg2 ; strings to print along with pid and title 
* RET nothing, dies on error 
xj 

narrate(char x msgl, char * msq2) 

i 

fprintf(stderr, CLIENT | %d]: %s % s\n", pid, msgl, msq2); 

] 

syserr(char » msgl) 

d 

char buf[ MSGLEN | ; 
sprintf(buf, "CLIENT [ $d]: $s”, pid, msgl); 
perror(buf): 

} 


get ticket 和 release ticket 是 程序 中 的 主要 函数 ,它们 都 遵循 下 面 的 规则 : 产生 短 请 
求 ,发 送 消息 给 服务 器 .等待 服务 器 的 应 答 ,然后 检查 应 答 和 根据 应 答 采 取 行 动 。 
get ticket 通过 发 送 命 令 HELLO 以 及 暴 跟 其 后 的 PID 来 请 求 票据 。 服务器 通过 发 送 
TICK ticket - id 接收 请 求 。 上 服务 器 发 送 下 AIL explanation 拒绝 请 求 。 
release — ticket 通过 发 送 命 令 GBYE ticket -id 芭 回 票据 。 如 果 票 撒 是 合法 的 ,服务 器 将 


Rik THNX greeting 消息 作为 应 和 莹 。 如 果 票 据 不 人 台 法 ,服务 器 发 送 FAIL explanation 消息 。 


为 何某 据 可 能 是 不 合法 的 ? 本 文 的 后 面 将 讨论 该 问题 ， 


13.6.2 服务 器 端 版 本 1 


JO X x EMO KO Xx X X X XX 4 ee ee ee ee ee GG EUN XOX X Xo dox X € ox Xo 3X0X X X ox ow ox o Xox HEE 
* lservi.c 
* License server server progran version 1 


x / 


# include <stdio.h> 
ttinclude <sys/types.h> 
H include  -sys/socket. h > 
H include <“netinet/in. h> 
# include simal. h> 

# include <i sys/errno. b> 


H define MSGLEN 128 /* Size of our datagrams */ 


int main(int ac, char » aw| ]) 
| 
struct Sockaddr in client addr; 


socklen t addrlen = sizeof(client addr); 
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char buf[MSGLEN '; 
int ret; 

int aock. 

sock = setup): 
while(1) | 


addrlen = sizeof(client addr); 
ret = recvfrom(sock,buf,MSGLEN,O,&client addr,&addrlen); 
if (ret!- -1{ 
bufi ret] = "0°; 
narrate( "GOT.", buf, &client_addr) ; 
handle request(buf,&client addr,addrlen); 
; 
else if ( errno 1 = EINTR } 


perror( "recvfrom'"); 


许可 证 服务 器 的 主 泵 数 是 一 个 循环 ,主要 包括 接收 客户 请 求 , 处 理 请 求 和 发送 应 答 。 其 
中 处 理 请 求 的 代码 包 会 在 lserv_funcsl.c AFP. 


JGROR ROX OX X X X X X X X X NOW X OX X X X 0X X d XX ORO de GEGEN GRUICAROE GNO ee EX ACOE X ee X 


* lsrv funcsl.c 
* functions for the license server 


X "i 


H# include -stdio.h > 

# include «i sys/ types. h> 
# include ~ SYS7 socket. hi> 
# include  -netinet/in.h-— 
H include << netdb. h> 

# include «signal. h> 


tHinclude «i SYS errno. h= 


# define SERVER PORTNUM 2020 /* Our server's port number x/ 
+ define MSGLEN 128 /* Size of our datagrams */ 
define TICKET AVAIL Q /* Slot is available for use x/ 
it define MAXUSERS 3 /* Only 3 users for us x/ 


F define oops(x) | perror(x?; exit( — 1); | 


JOR OX X X X X X OX Xx X X X X ROX X X X X X X X ox X X X X X X ox o» HEHE SHENK HR X Xo X X Mx X X X & x x X WX ox* x ox 


x Important variables 


, 


x; 
int ticket array| MAXUSERS ]- /* Our ticket array «/ 
int sd = -1; /* Our socket x/ 


int num tickets out = 0; jx Number of tickets outstanding x/ 


FP 
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char * do hello(); 
char * do goodbye() ; 


SEX EKER RRHRK EAH KH HS KRM RRR KRHA KK EK ERE HHH RHE HEE M X X MX o3 XX O3 dX OX OG OR O6o0X $4 X x X a 
* setup() - initialize license server 

xj 

setup() 


| 
à 


sd = make dgram server SoCket(SERVER PORTNUM); 
if (sd == -1) 
oops( “make socket"); 
free all tickets(); 
return asd: 
free all tickets() 


了 
1 


int i: 


, 


for(i-0; 1</MAXUSERS;: i++) 


F 


ticket array[i] = TICKET AVAIL; 


六 
x shut down() — close down license server 
x / 
shut down() 
close(sd); 


(RRR Ex MRD HEE OG X dk OX € GROX o6 OX Xo OX X o3o0X€ € 0X Xo X X GC OX X X RRM RAKE OX X XX X RRA HE 
x handle request(request, clientaddr, addrlen} 
* branch on code in request 
xj 
handle request(char * req,struct sockaddr in * client, socklen t addlen) 
| 
char * response; 


int ret; 


/* act and compose a response «/ 

if ( strnemp(req, "HELO", 4) == 0) 
response = do hello(req); 

else if ( strncmp(reg, "GBYE", 4) == 0) 
response = do goodbye(req); 

else 


response - "FAIL invalid request"; 





404 * Unix/Linux WE SK Eg UE 





/* gend the response to the client +/ 

narrate( "SAID,", response, client); 

ret = sendto(sd, response, strlen(response),0,client, addlen); 
if (ret == -1) 


perror( "SERVER sendto failed”); 


See X XX RRR KEK 4 X X 4 X X X 0X X KEKE X Gb A x X 0X XX 0X 363 A6 X e XX KES K KER KHKHKERRHHHK EHH o 


i 


ae 


do hello 
* Give out a ticket if any are available 


* IN msg p messago received from client 


x 


Results, ptr to response 
* Note. returnis in static buffer verwritten by each call 
* NOTE, return is in static buffer overwritten by each call 
xj 

char * do hello(char * msg p? 

1 

int X; 


static char replybuf| MSGLEN!; 


if(num tickets out = = MAXUSERS) 
return("FAIL no tickets available"): 


/* else find a free ticket and give it to client */ 
for(x = 0; x< MAXUSERS && ticket array[x] | = TICKET AVAIL; x++) ; 


/* A sanity check 一 should never happen »/ 
if(x == MAXUSERS) | 
narrate( "database corrupt","" NULL); 
return( "FAIL database corrupt"); 


/* Found a free ticket. Record "name" of user (pid) in array. 
x generate ticket of form. pid. slot 
»/ 
ticket array|x] = atoi(msg_p ! 5); /* get pid in msg x/ 
sprintf(replybuf, "TICK *d. $d", ticket array[ x], x); 
num tickets out -t*; 
return(replybuf): 
} /* do hello */ 


jOROKCEOX OK KOX X OX OX X X 3 X X XOX X X X X X X X 0X X034 4 X X X X € X X OK KO X X XO X X OX XX X X X X RAR K XO EK 
* do goodbye 

* Take back ticket client is returning 

* IN msa p message received from client 


* Results. ptr to response 


——— Ia. 一 一 一 一 一 
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* Note. return is in static buffer over written by each call 
x? 
char * do goodbye(char x msg p) 


i 
int pid, slot; /* components of ticket */ 


/* The user’s giving us back a ticket. First we need to get 
x the ticket out of the message, which looks like; 


* 


» GBYE pid. slot 
* f 
if((sscanf((msg p + 5), "&d. &d", &pid, &slot) | = 2) | 
(ticket array| slot] ! » pid?) : 
narrate("Bogus ticket", msg p* 5, NULL); 
returni "FAIL invalid ticket"); 


` 
E 
1 


/* The ticket is valid. Release it. «/ 
ticket array|slot| = TICKET AVAIL; 


num tickets out--; 


/* Return response *; 
return( "THNX See yal"); 
| /* do goodbye */ 


(HREM x XOKOA OX OROKCROA X X X X X Wo X XOXOX KO X X ox o x XX K&K Ww Xx We Xo3xoX* X X C x X o X Xo 7€ X xk X EE X X OX HEE 
x narrate() - chatty news for debugging and logging purposes 
w 
narrate(char x msgl, char * 4sq2, struct sockeddr in * clientp) 
i 
fprintf(stderr, AtXtSERVER. *s $s", msgl, msg2); 


if ( clientp ) 


fprintf(stderr,"( t s; $d)",inet ntoa(clientp- --sin addr), 
ntohs(clientp- sin port? ); 
putc('An', stderr); 


3 ZEN ISXERERVT. 

(1) handle request 

请 求 由 4 个 字符 的 命令 带 … 个 参数 构成 。 服 务 器 先 检 查 命令 ,然后 调用 对 应 的 两 数 。 风 
使 命令 不 合法 ,服务 器 也 必须 发 送 应 答 , 否 则 客户 会 一 直 阻 塞 下 去 。 

(223 do. hello 

HELO fe > FAK OK Sus . 服务 器 查找 票据 数组 寻找 空 附 的 项 ， 如 果菜 项 的 PID fü» 
0, 表 示 这 是 一 个 可 用 票据 。 服 务 器 使 用 独立 的 变量 num tickets out 来 节省 时 间 。 服 务 器 


oor —— ——— r — € o——— € 
pP 一 一 
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(3) do goodbye 

GBYE 命令 是 返回 票据 的 请 求 。 票 据 是 -个 由 PID ARRAS PE RO 
将 票据 的 PID 和 票据 编号 与 签 出 列表 (sign-out list) 中 的 值 进 行 比较 ,如 果 数 据 一 致 ,服务 
器 从 签 出 列表 中 清除 该 项 的 值 并 有 旦 致谢 客户 。 如 果 不 一 致 , 则 一 定 是 行 么 地 方 发 生 了 错 讼 。 

如 果 你 是 飞机 上 场 的 检票 员 , 如 果菜 个 客户 给 出 存根 的 编号 和 名 字 在 数据 库 中 不 存在 ,你 
就 可 能 会 问 : 你 是 从 哪里 竺 到 这 张 票 的 ,你 是 谁 ” 后 面 将 讨论 伪造 音 揪 问题 ， 下面 来 测试 
这 个 版 本 的 程序 。 


13.6.3 测试 版 本 1 
编 详 服务 絮 问 程序 并 在 后 台 运 行 它 。 





$ cc lservi.c lserv funcsi.c dgram.c - o isarvl 
$ ./lservl& 
[1] 25738 


编 详 好 客户 端 程序 ,然后 同时 运行 4 个 实例 ， 


$ ec 1elnt1.c lelnt funcsi.c dqram.c - o lclnti 
$ .f/lclntl£&./lclntl&,./lclntl&. /lclnt]| & 


SERVER, GOT HELO 25912(10.200.75.200.1053) 
SERVER: SAID, TICK 25912.0€10. 200. 75. 200,1053) 

CLIENT 25912 :get ticket 25912. 0 

SuperZleep version 1.0 Running Licensed Software 
SERVER: GOT, HELO 2591310. 200. 75. 200.1054) 
SERVER: SAID, TICK 25913. 1(10. 200. 75. 200,1054) 

CLIENT[L 25913 ],got ticket 25913. 1 

SuperSleep version 1.0 Running - Licensed Software 
SERVER : GOT: HELO 25915(10.200. 75. 200.1055) 
SERVER; SAID; TICK 25915.2¢10. 200.75, 200;1055) 

CLIENT] 25915 |: got ticket 25915, 2 

Supersleep version 1.0 Running - Licensed Software 
SERVER; GOT, HELO 25914(10.200.75,200,10592 
SERVER:SAID,FAIL no tickets available (10.200,75, 200.1059) 

CLIENT: 25914 Could not get ticket FAIL no tickets available (10.200.75.200.1059) 
SERVER; GOT; GBYE 25912.0(10. 200. 75. 200; 1053) 
SERVER, SAID,THNX See ya! (10. 200. 75, 200.1053) 

CLIENT[25912].released ticket OK 
SERVER; GOT: GAYE 25813, 1(10. 200, 75. 200.1054) 
SERVER; SAID; THNX See ya! (10.200,75. 200.1054) 

CLIENT| 25913].released ticket OK 
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SERVER: GOT: GRYF 25915.2(10, 200. 75. 200;1055) 
SERVER. SAID. THNX See ya! (10.200.75. 200.1055) 
CLIENT(25915 .released ticket OK 


实际 运行 的 程序 可 能 有 非常 不 同 的 结果 。 尽 管 如 此 .从 中 可 以 看 到 服务 器 如 何 接收 请 
x .给 出 票据 以 及 客户 端 如 何 获取 票据 并 开始 工作 的 : 可 以 看 到 进程 25914 878 13 $99 TE, 
因为 在 该 进程 出 现时 ,所 有 的 票据 者 已 经 被 占用 了 ,而 之 前 进 穆 25915 AB T — 53K n 
如 果 运 行 该 程序 多 次 ,可 能 会 看 到 不 同 的 结果 


13.6.4 进一步 的 工作 
版 本 1 的 许可 证 了 服务 器 可 以 很 好 地 工作 了 ; 服务 器 处 再 请 求 并 且 维 持 持 有 素 据 的 进程 
列表 、 客 户 可 以 从 服务 器 得 到 票据 。 现 在 为 止 一 切 都 正常 。 和 看 起 来 这 非常 理想 。 不 过 现实 
此 界 并 不 总 这 样 美 好 .软件 及 其 使 用 者 并 不 完 企 是 你 所 期 望 的 那样 。 可 能 出 珊 什 么 错误 呢 ， 
etl tip 


13.7 人 处理 现实 的 回 题 


这 里 的 许可 证 服务 器 能 很 好 地 工作 ,前 提 是 所 有 的 进程 是 正常 工作 的 。 有 时 ,软件 可 能 
运行 出 第 。 如 采 SuperSleep 程序 第 妨 外 一 个 用 己 杀 死 了 ,或 者 程序 发 生 段 存 取 错误 而 被 内 
核 杀 死 了 .该 如 何 呢 ?” 对 于 它 所 占用 的 票据 该 如 何 处 理 呢 ”如果 服务 器 月 沉 了 怎么 呢 ? 在 
服务 器 重 局 后 又 将 发 生 什 么 呢 ? 

现实 世界 中 的 程序 必须 能 够 处 理 异 常 央 涡 。 这 里 考虑 两 种 情形 : 客户 端 崩 泪 和 服务 器 


13.7.1 处 理 客 户 端 崩溃 
如 果 客 户 端 崩 泪 ,客户 将 不 会 归还 票据 ,如 图 13. 8 所 示 。 


| 签 出 列表 中 死 进 
程 对 应 的 条 目 


AAS TARERE UE 
将 不 会 返回 票据 





图 15.8 客户 不 归还 票据 


在 出 租车 公司 里 ,雇员 可 能 侠 职 .被 解聘 . 回 家 或 死亡 ,但 仍 持 有 公司 轿车 的 钥匙 。 这 些 
对 公司 将 造成 什么 影响 呢 ? 签 出 列表 指明 票据 仍 锌 占 用 。 其 他 进程 就 不 能 得 到 该 票据 。 但 
十, 如 来 有 足够 多 的 进程 崩溃 . 签 出 列表 就 可 能 虽然 满 了 ,但 此 时 却 没有 运行 的 客户 程序 ， 

乌 是 管理 员 通 过 给 持 有 钥匙 的 人 打 电 话 ,就 可 以 收回 钥匙 。 他 可 以 定期 地 浏览 得 出 列 
表 , 然 后 给 每 个 司机 打 电 话 ,“ 你 仍 在 使 用 车 胞 ?2”。 如 果 无 人 响应 ,管理 员 把 他 的 名 学 从 得 出 
HRPA. 管理 员 检查 的 频率 越 高 , 答 出 列表 的 精确 性 就 越 高 。 
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许可 证 服务 器 可 以 使 用 相同 的 技术 .定期 检查 票据 数组 ,确认 其 中 的 每 个 进程 是 否 还 活 
着 ?如 果 某 个 进程 已 经 不 存在 了 ;服务 器 可 以 把 该 进程 从 数组 中 去 除 ,有 释放 其 占用 的 囚 据 ， 
检查 程序 运行 的 越 频繁 ,数组 的 精确 性 越 高 ， 

l. X E £X 60x46. 调度 

服务 器 中 如 何 增加 收回 票据 的 代码 ”如何 调用 这 些 代 人 码 ? 服务 器 必须 实现 两 个 独立 的 
操作 : 等 竺 客户 的 请 求 , 同时 周期 性 地 收回 丢失 的 票据 。 而 调度 行为 是 简单 的 : 只 要 使 用 
alarm 和 signal 技术 来 周期 地 调用 一 个 函数 ,在 前 面 章节 的 移动 文字 例子 中 ,使 用 了 这 种 靶 
术 。 修 订 的 程序 流程 如 图 13. 9 Pra. 


STY 







ee 


WR 
= 
| 
| preeess. "E 
应 答 D 
i) : |j-Eeply to req 


[7 "rasbare aları = 
i EI 


— BH 13.9. (EH alarm XE DUE SURE DERE 


E WEE Fa I8] ET AE RP E38 Ti ORSURI FE ET a E REA E OR SCC (RI E rh ZR. MOR RH AB IE TE 
处 理 客户 请 求 的 同时 ,被 SIGALAM 1i ^ fü Az 8] FE [n] c SER 89 98 HE eR. 7E "E [n] BI? 
ix j^ Ab SUPE EE tak de CE NU EU ig NAE BU. AC E m RS EE. ifi] ur [E] 
票据 也 第 要 修改 签 出 列表 。 这 种 冲 闪 可 能 会 破坏 数据 的 一 致 人 性 吗 ? 该 间 题 留 作 课 后 练习 ， 
考虑 到 安全 性 .在 处 理 请 求 的 时 候 关 闭 alarm, 

2. M €) E X 6) RB: 编程 

ARS di EB BB In CARA HED. BSA PE AK EET 可 以 使 
用 popen 来 运行 ps, 然 后 从 ps 的 输出 中 查找 PID, 以 确定 持 有 票据 的 PID 是 否 存 在 。 另 一 
种 快速 简洁 的 方法 是 使 用 kili 系统 调用 的 特 跌 功能 . 

可 以 通过 给 进程 发 送 编号 为 0 的 信号 以 确定 它 是 从 存在 。 如 梨 进 程 不 存在 ,内 核 将 不 会 
发 送信 号 ,而 是 返回 错误 并 设置 errno 为 ESRCH, Tt ticket reclaim 中 使 用 了 该 特征 ,该 消 
Gy HE lserv_ funcs2. c 文件 中 : 


# define RECLAIM INTERVAL 60 /* reclain every 60 seconds x/ 
fae men ee UM X XN KM 
» ticket ceclaim 
* go through all tickets and reclaim ones belonging to dead processes 
x Results, none 
»/ 
void ticket reclaim() 


| 
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int i; 
char tick[BUFSIZ]; 
for(i = 0; i << MAXUSERS; i++) 
if((ticket array|i] 1 = TICKET AVAIL) && 
(kill(ticket array[i;, 0) == -1) && (errno == ESRCH)) | 
/* Process is gone — free up slot x/ 
sprintf(tick, "$d. €&d", ticket array[i],i1); 
narrate("freeing", tick, NULL); 
ticket array|i/ = TICKET AVAIL; 


num tickets out-- ; 


i 
alarm( RECLAIM INTERVAL): /* reset alarm clock x/ 


i 


接 下 来 ,在 main A% piš n dd BE REAR. EEE 2E PE P ORB] alarm。 修 改过 
的 main 在 文件 Iserv2. c 中 ; 


int main(int ac, char x av| ]) 
{ 
struct sockaddr client_addr; 
socklen t addrlen= sizeof(client_addr) ; 
char buf! MSGLEN |; 
int ret, sock; 
void ticket reclaim(); /* version 2 addition #/ 


unsigned tine left; 


sock = setup(): 


signal (SIGALRM, ticket reclain); /* run ticket reclaimer x/ 
alarm(RECLAIM INTERVAL), /* after this delay «/ 
while(1} | 


addrlen = sizeof(client addr); 
ret = recvfrom(sock,buf,MSGLEN,O,&client addr,&addrlen); 
if ret |- +1 }f 
buf] ret] = "\Q'; 
narrate( "GOT," buf, &client addr):; 
time ieft = alarm(0); 
handle request(buf,&client addr,addrien); 
alarm(time left}; 
I 
else if ( errno |= EINTR ) 
perror(“reevfrom"} ; 


j 


—_ im 
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通过 上 面 的 修改 ,许可 证 服务 器 就 可 以 周期 性 地 检查 票据 了 。 确 实 需 要 这 样 周 期 性 地 
从 查 吗 ”为 什么 不 只 在 票 掏 列 表 满 了 并 且 有 客户 的 请 求 被 拒绝 的 时 候 检 查 呢 ? xx FEM 


BEAR? 
13.7.2 AISA SSS BB 

服务 器 崩溃 通常 有 两 个 严重 的 后 果 。 首 先 , 莹 出 列表 丢失 ,失去 进程 持 有 票据 的 记录 。 
其 次 ,新 客户 不 可 以 再 运行 ,因为 分 发 寿 可 证 的 程序 已 经 不 存在 。 最 简单 的 解决 方法 是 重新 
启动 服务 器 .如 图 13. 10 所 示 。 


先前 服务 器 
At Tp tS SR 
P a. 





- [LEE amv HR 
| pue T — à RB 


ESSE: 


图 13.10 — BR SS ah E Md er E d 


重启 服务 器 使 得 新 的 客户 可 以 运行 ,但 会 带 来 两 个 新 的 问题 。 

首先 ,重启 服务 器 的 票据 数组 是 空 的 ; 服务 器 含有 新 的 未 被 取 走 的 票据 列表 。 鞠 省 的 服 
务 器 的 票据 数组 可 能 已 经 满 了 ,而 重启 服务 器 仍 给 其 他 容 户 发 送 许可 ,这样 重复 地 关闭 服 
务 器 .再 重启 服务 器 就 像 印 钞 机 一 样 可 以 产生 更 多 的 票据 。 

其 次 , 持 有 旧 的 服务 器 的 票据 的 客户 在 归还 票据 时 .将 会 被 认为 是 伪造 票据 ， 

|， 票据 验证 

上 述 问题 的 一 个 解决 方法 是 票据 验证 。 页 据 验 证 表示 每 个 客户 周期 性 地 向 服务 器 发 送 
票据 的 副本 。 客 户 发 送 数据 包 , 对 服务 器 说 ;这 是 我 的 票据 。 嘴 各 法 的 吗 ?", 如 图 13. 1 





图 13, 11 客户 验证 票据 


tee ZH SA PLD。 服 务 器 检查 签 出 列表 。 如 果 该 项 为 空 ,服务 器 可 以 认为 该 
票据 是 自己 先前 的 实例 赋予 的 服务 器 将 会 到 该 票据 加 到 列表 中 。 逐 步 地 ,客户 提供 票据 
来 验证 , 签 出 列表 被 重新 续 人 。 

服务 器 重建 签 出 列表 解决 了 表 盏 失 问 题 .但 可 能 导致 其 他 问题 。 如 果 一 个 新 的 客户 在 
表 重 建 好 之 丽 , 请 求 票据 ,服务 器 可 能 分 发 一 个 已 经 给 子 其 他 窜 户 的 票据 给 该 客户 。 当 持 有 
上 日 的 票据 的 客户 对 其 覃 据 进 行 验证 时 ,服务 器 会 拭 绝 亡 . 
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23 phy EARS HMR RAWAM SE. Foe SEHE SETS S PSR H 
的 。 这 种 方法 是 否 更 好 ? 

2 协议 中 增加 验证 

不 据 验 证 是 协议 中 的 一 个 新 的 事务 : 

CLIENT:VALD tickid 

SERVER, GOOD or FAIL invalid ticket 


这 里 必须 改变 客户 和 和 服务 器 以 支持 验证 。 
3， 客 户 端 增加 验证 
客户 器 增加 验证 ,需要 编写 一 个 隔 数 并 在 主 锁 数 中 油 用 它 , 其 流程 如 图 13. 12 所 示 ， 
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客户 可 以 根据 系统 的 需要 以 一 定 的 同 隅 定期 验证 票据 ,可 以 设置 一 个 计时 器 来 定期 验 
证 。 和 如 果 客 户 是 一 个 电子 制 表 程序 , 答 证 可 以 在 一 定量 的 计算 结束 后 进行 。 一 个 许可 证 服 
务 器 会 啊 应 验证 请 求 。 

SuperSleep 客户 程序 可 以 把 10 秒 的 睡 跟 时 间 分 割 成 两 个 5 秒 . 在 这 期 间 进 行 验证 。 这 
作为 课 后 练习 . 

4, RA E in dE to BUI 

服务 器 端 增加 验证 需要 做 两 处 改动 。 改 劲 后 的 程序 位 于 新 的 文件 sere funcs2. c 中 。 
首先 ,增加 一 个 函数 环 验 证 票据 : 


fW Rx EMH KN RR ACE RH Ce XXX OXON RN Re RN te 
x do, validate 
* Validate clrent’s ticket 
x IN msg p message received from client 
+ Resuits: ptr to response 
* NOTE. return is in static buffer overwritten by each call. 
*/ 
static char x do validate(char * msg) 
( 
int pid, slot; /* components of ticket x/ 


/x msg looks like VALD pid. slot - parse 5t and validate x/ 


有 
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if (sscanf(msg + 5," & d. € d", &pid,&slot) == 2 && ticket array[slot! == pid) 
return( "GOOD Valid ticket"); 


/* bad ticket «/ 
narrate( "Bogus ticket", msg + 5, NULL); 
return("FAIL invalid ticket"); 


Hk ,.handle request 中 增加 更 多 的 判断 ， 


handle request(char x req,struct sockaddr in * client, socklen t addlen) 
| 


char » response; 


int ret; 


f* act and compose a response x/ 


if € strncmp(req, "HELO", 4) == 0) 
response = do_hello(req) ; 

else if ( strncmp(req, "GBYE", 4) == 0) 
response = do goodbye(req) ; 

else if ( strnomp(reg, "VALD", 4) == 0 } 
response = do validate( req) ; 

else 
response = “FAIL invalid request”; 


/* send the response to the client «/ 


narrate( "SAID," 


f 


response, client); 
ret = sendto(sd, response, strlen(response),0, client, addlern); 
if ( ret == -1) 

perror( "SERVER sendto failed"); 


13,7.3 测试 版 本 2 


现在 可 以 编译 和 测试 新 版 本 的 客户 和 服务 器 了 。 测 试 包含 了 杀 死 客户 和 服务 器 以 及 重 
局 客户 和 服务 器 。 试 观察 输出 中 的 进程 ID 和 消息 。 为 了 便于 测试 ,客户 睡眠 时 间 为 两 个 15 
AD AY al Aa AR AS 5 PPS CE. SRE 


$ cc lserv2.c lserv funcs2.c dgram.c - o lserv2 


5 ec lelnt2.c lelnt funcs2.c dgram.c - o lelnt2 


$ «/leervis # 启 动 1 个 服务 器 
[1]30804 
S ./lelnt2&./lclnt2&£./lclnt2& +# f3xh 3-T PW 
[2130805 


[3j30806 


SS SS II a MÀ MH M 
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| 4 ]39807 
5 SERVER. GOT. HELO 30805 (10.200.75.200.1085j 
SERVER: SAID: TICK 30805. 0 (10.200.75.200,1085) 
CLIENT [30805 |; got ticket 30805.0 
SuperSleep version 1.0 Running - Licensed Software 
SERVER, GOT. HELO 30806 (10.200.75,200,1086) 
SERVER: SAID, TICK 30806. 1 (10.200.75.200,1086) 
CLIENT [30806 , :get ticket 30806. 1 
SuperSleep version 1.0 Running - Licensed Software 
SERVER: GOT. HELO 30807 (10.200.75.200,1087) 
SERVER, SAID, TICK 30807.2 (10.200, 75. 260.1087} 
CLIENT [ 30807 | ;got ticket 30807. 2 
SuperSleep version 1.0 Running - Licensed Software 
S kill 30806 4kill 一 个 客户 
[3]- Terminated . /1clint2 
SERVER; freeing 30806. 1 
SERVER: GOT, VALD 30805.0 (10. 200.75, 200.1085) 
SERVER: SAID. GOOD Valid ticket (10,200.75. 200.1085) 
CLIENT [30805 |, Validated ticket. GOOD Valid ticket 
SERVER, GOT . VALD 30807.2 (10.200.75.200,10875 
SERVER: SAID; GOOD Valid ticket (10.200.75,.200,1087) 
CLIENT [30807 |, Validated ticket; GOOD Valid ticket 
$ kill30804 #kill 服务 器 


| t ‘Terminated Serv2 

S ./lserv(k + Mig us 
[5]30808 

S 


SERVER: GOT, GBYE 30805.0 (10.200. 75. 200, 1085) 

SERVER, Bogus ticket 30805.0 

SERVER; SAID, FAIL invalid ticket (10.200.75.200.1085) 
CLIETN| 30805 |. release failed invalid ticket 

SERVER.GOT, GBYE 30807.2 (10.200.75.200,1087) 

SERVER. Bogus ticket 30807.2 

SERVER, SAID, FAIL invalid ticket (10. 200.75. 200,1087) 
CLIETN[ 30807 | . release failed invalid ticket 
$ ./lelnt2 Sum - T3 mer 

SERVER, GOT, HELO 30809 (10.200.75.200,10857 

SERVER; SAID, TICK 30809.0 (10.200. 75. 200.1087) 
CLIENT [30809 ] ,got ticket 30809.0 
SuperSleep version 1.0 Running - Licensed Software 

SERVER, GOT . VALD 30809. 0 (10.200.75.200.1087) 

SERVER; SAID, GOOD Valid ticket (10.200.75.200,1087) 
CLIENT [30809 '. Validated ticket, GOOD Valid ticket 

SERVER: GOT; GBYE 30809.0 (10.200. 75, 200.1087) 
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SERVER. SAID, THNX See ye! (10.200. 75. 200,1087) 
CLIENT (30809 ], release ticket OK 


[2] Dene . /1clnt2 
[4]- Done . /1Lclnt2 
$ PS 

Pn TTY TIME CMD 


23500 pts/3  00;00,00 bash 
30808 pts/3 00:00:00 lserv2 
30810 pts/3 00-00,00 ps 

$ 


EREET. KAP CRB WRAP MOREE. 


13.8 分 布 式 许可 证 服务 紫 


许可 证 服务 器 和 被 许可 程序 通过 socket 进行 通信 ，socket 可 以 连接 不 同 主机 上 的 进程 。 
理论 上 ,与 Web 服务 器 和 客户 运行 在 不 同 主机 上 类 似 , 这 里 的 客户 可 以 运行 在 一 台 机 器 上 。 
而 服务 器 运行 在 另 一 台 机 器 上 。 当 它们 运行 在 不 同 的 机 器 上 时 ,会 有 问题 吗 ? 是 的 。 

”问题 1: 重复 的 进程 ID 

进程 ID 在 一 台 机 器 上 是 惟一 的 ,但 在 不 同 主机 上 的 进程 可 能 拥有 相同 的 进程 ID。 图 
13. 13 说 明 的 情况 不 含有 任何 错误 上 且 很 常见 ， 


许可 证 服务 器 





图 13.13 BW PID 不 惟一 


存放 票据 的 表 中 含有 PID MIS. AA 13. 13 的 情况 中 ,许可 证 服务 将 认为 给 同 
一 个 进程 分 配 了 3 张 票 。 每 个 进程 只 要 一 张 票 就 可 以 运行 ,所 以 这 是 错误 的 。 请 求 更 多 的 票 
据 , 可 以 被 认为 是 客 广 端的 一 个 漏洞 。 

这 里 可 以 扩展 票据 表 项 的 格式 和 内 容 , 使 其 包含 标识 运行 程序 的 主机 从 而 解决 重复 PID 
问题 。 

- WHE 2. 回收 票据 

服务 器 通过 调用 kill(pid,0) 命 令 向 客户 回收 票据 。kul(pia,0) 发 送信 和 号 0 给 持 有 票据 
的 进程 。 通 过 修 林 过 的 票据 表 , 服 务 器 现在 可 以 知道 客户 运行 在 哪 台 主机 上 。 

但 是 .服务 器 不 能 给 其 他 机 器 上 的 进程 发 送信 号 ,如 图 13, 14 所 示 。 如 果 许 可 证 服务 器 
想 给 主机 3 上 的 进程 发 送信 号 .服务 喝 必须 产生 主机 3 上 的 请 求 。 
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l = | 主机 | 
图 13,14 进程 不 能 给 其 他 主机 发 送信 号 


为 什么 不 在 每 台 机 器 上 都 运行 一 个 服务 器 的 实例 ” 如 图 13.15 Bros BH CH AD AR S 
器 可 以 监控 于 失 的 票据 .。 
许可 证 服务 器 证 可 证 服务 器 ”许可 证 服务 器 


13.15 运行 本 地 复制 的 lserv 


本 地 服务 器 解决 了 向 主机 发 送信 号 的 问题 :但 是 又 带 来 新 的 问题 : 哪个 服务 器 发 布 紧 
W? 主 服务 器 如 何 和 本 地 服务 器 通信 ? 客户 把 票据 发 给 谁 验证 ? 

。 问题 3: X BLAST 

如 果 其 中 的 一 各 机 器 停止 运行 ,将 会 发 生 什 么 ? 主 最 务 器 如 果 还 在 运行 的 话 ,如 何 收 僻 
mimo yu Ema uxo 如 时 运行 主 服 务 器 的 主机 停止 运行 , 谁 来 分 发 票据 ”? 

如 何 建立 一 个 分 布 式 许可 证 系统 来 同时 文 持 多 台 机 器 ? 这 里 有 3 种 方法 。 试 考虑 它们 
的 设计 细节 以 及 优 缺 点 .并 考虑 当 容 户 . 服 务 器 .计算 仙 或 者 网 络 期 总 时 每 个 方案 的 后 浊 。 

。 方法 1: 客户 端 服务 器 和 中 央 上 服务器 通信 

每 台 机 器 都 有 一 个 本 地 服务 器 ,就 像 本 文 编写 的 那样 。 每 个 客户 跟 本 地 的 服务 器 通信 ，。 
本 地 服务 器 把 请 求 转发 给 中 央 服 务 强 。 中 央 服 务 器 返回 票据 或 者 拒绝 。 本 地 服务 器 记录 并 
把 应 管 转发 给 客户 。 本 地 服务 器 也 可 以 强制 执行 一 些 对 本 地 客户 的 限制 .例如 该 机 器 上 可 
以 运行 的 程序 实例 数 . 或 者 程序 可 以 运行 的 时 刻 。 

， 方法 2: 每 个 客户 都 和 中 央 服 务 器 通信 

客户 直接 给 特定 主机 上 的 服务 器 发 送 请 求 。 本 地 服务 器 运行 在 每 个 主机 上 ,但 这 些 航 
务 问 不 和 客户 通信 ,它们 在 重新 声 明 票 拓 的 时 候 作 为 中 央 服 务 器 的 代理 ， 

(FEI: 窗户 服务 器 和 客户 服务 器 通信 

每 台 忆 器 邵 有 本 地 服务 器 ,每 个 客户 跟 本 地 服务 器 通信 。 没 有 中 央 圾 务 器 。 所 有 的 本 
地 服务 丫 癌 互相 通信 。 每 次 一 个 客户 请 求 时 .本 地 服务 器 询问 其 他 所 有 的 服务 器 目前 已 经 
用 掉 了 多 少 张 票 。 如 果 所 用 票据 数 小 于 所 允许 的 总 数 . 本 地 服务 器 分 虑 一 张 票 握 给 客户 . 
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13.9 Unix 域 socket 


本 章 的 许可 证 服务 器 中 的 socke 使 用 标准 的 主机 ID 和 端口 号 地 址 系统 。 使 用 这 些 
Internet 地 址 ,服务 器 可 以 接收 本 地 的 乃至 蝎 大 网 络 上 机 器 的 客户 请 求 。 

在 上 述 的 两 种 分 布 式 洗 可 证 服务 器 模型 中 , 客户 只 需 和 同一 台 主 机 上 的 服务 器 通信 。 
socket 只 能 用 在 仅 限 于 主机 内 部 的 通信 中 玛 ? 


13.9.1 文件 名 作为 socket 地 址 


有 两 种 连接 : 流连 接 和 数据 报 连接 ,也 有 两 种 socket HEAL. Internet 地 址 和 本 地 地 址 。 
Internet 地 址 包含 主机 ID Hw Ss, A He hh i PY ie Unix 域 地 址 , 它 是 -个 文件 名 《 例 
ün/dev/log./dev/printer n /tmp/lserversock) , t£ 3: SLf 9 E15. 

两 个 socket $ /dev/log fil/dev/printer 被 用 在 很 多 Unix ARP. /dev/log # syslogd 
RSS AEA. Bigs AA RS lh WA dev/log 的 socket A xx A RAITI. 
Jil /dev/ printer 被 一 些 打 印 系 统 使 用 。 


13.9.2 JP Unix 域 socket 编程 


为 了 学 习 Unix Bl socket 的 客户 /服务 器 编程 ,这 里 编写 了 一 个 日 志 系 统 。 文 件 wimp 
就 是 日 志 系 统 的 … 个 实例 。 文 件 wimp RAR MARR BHR. RRR 
证 安全 和 系统 维护 的 程序 所 使 用 ,用 来 记录 一 : 些 可 疑 行为 。 莫 志 服 务 器 是 一 个 抄写 员 ;， 客户 
发 送信 息 给 服务 器 ,服务 器 将 这 些 信息 保存 到 只 有 自己 可 以 修改 的 文件 中 。 日 志 服 务 器 可 
以 用 任何 格式 保存 该 文件 ,客户 并 不 知道 这 些 央 节 。 

这 里 的 日 志 服 务 老 使 用 Unix 域 socket 地 址 。 只 有 同一 台 主 机 上 的 客户 才能 发 消息 给 
它 。 下 面 是 客户 种 服务 器 的 代码 。 服 务 器 先 创建 socket, RHE MHL: 


JOkGROREGX OX MOX OX OX EKME MARKER ERR KEKE MOK EKER KK PERK AC XXX RH RK EXE EUX Xo XXX OE 
* logfiled.c — a simple logfile server using Unix Domain Datagram Sockets 

x usage; logfiled >>> logfilename | 

x / 


iinciude  «stdio.h— 

H include  «sys/types.h- 
# include «< sys/ socket. h> 
# include «< sys/wm. k> 


# include «i time. hi> 


~ # define MSGLEN 512 
# define cops(m,x) 1 perror(m); exit(x); ; 


H define SOCKNAME "/tmp/logfilesock" 


int main(int ac, char * av[ |) 


| 


一 一 一 一- -一 -一 + 一 一 一 一 or or ro e. * ^e o ot rt 


第 13 音 BRE Datagram) H3 48 E: 5 ral urs RY «dif * 





int sock ; /* read messages here x/ 
struct sockaddr un addr; /x this is its address x/ 
socklen t addrlen:; 

char msg[ MSGLEN | - 

int 1; 

char sockname, = SOCKNAME ; 

time_t now; 

int msqnum = 0; 

char * timestr; 


/* build an address «x / 
addr.sun family - AF UNIX; /* note AF UNIX «/ 
strepy(addr. sun path, sockname? ; /* filename is address x/ 


addrlen = strlen(sockname) + sizeof(addr.sun family); 
sock = socket(PF UNIX, SOCK DGRAM, 0); /* note BF UNIX x/ 
if ( sock == 一 1 ) 
oops( "socket", 25 ; 
"x bind the address x/ 
if ( bind(sock, (struct sockaddr x } &addr, addrlen) == -1) 
oops("bind", 3); 


/x read and write */ 


While(1) 

| 
l = read(sock, msg, MSGLEN) ; /* read works for DGRAM «; 
msgl l] = 'XO'; ix make it a string #/ 
time(&now); 


timestr = ctime(&now): 


timestr|strlen(timestr)- 1 = 'X0" /* chop newline x/ 


printf("| &5d| %s * sn", msgnum * * , timestr, msg); 
fflush(stdout); 


这 里 仍 使 用 socket 和 bind 来 创建 服务 器 socket, socket 的 类 型 是 SOCK DGRAM, ,地 
dE aE PF_UNIX®, socket 地 址 是 文件 名 。 使 用 read 而 不 是 recvfrom, 因 为 不 需要 应 管 。 
下 面 是 客户 端 程 序 : 


PE 
* logfilec.c — logfile client - send messages to the logfile server 


x usage: logfilec "a message here" 


(D PF LOCAI th ikBe ft [C PF UNIX, 
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— M "o O — 


# include -= stdio.h 
finclude  «sys/types.h- 
# include «isyys; socket. hi> 


+# include -Cays/un, h> 


E define SOCKET "/tmp/logfilesock" 


# define OOps(m,x) | perror(m?; exit(x); | 


main(int ac, cher » av| 1) 


t 
! 
int sock; 


struct sockaddr un addr; 


socklen t addrlen; 

char sockname| | = SOCKET ; 
char * msg = av[1l; 
if¢acl= 2) 


fprintf(stderr, usage. logfilec 'message'\n"); 
exit¢1>-: 

j 

sock = socket(PF_UNTX, SOCK DGRAM, 0); 

if ( sock == -1) 


oops "socket" 2); 


addr.sun family = AF UNIX; 
strcpy(addr.sun path, sockname) ; 


addrien = strlentsockname) + sizeofí(addr.sun family) - 


if { sendtotsock,msg, strlen(msg), 0, &addr, addrlen) == 一 1 ) 


cops( "sendto" 3}; 


这 里 使 用 socket FA BOR GM socket, JF FLfE RE sendto 发 送 消息 。 服 务 器 接收 消息 ,然后 
打印 消息 。 消 息 前 面 是 销 息 编 导 和 时 间 。 
下 面 是 测 达 的 情形 : 


$ cc logfiled.c - o logfiled 

38 ./logfiled —-visitorlod* 

150D 

§ cc logfilec.c - o logfilec 

$ .flogfilec ‘Nice system. Swell software! ' 

5 ./logfilec "Testing this log thing." 

5 ./logfilec "Can you read this?" 

$ cat vistorleg 

| Ò] Mon Aug 20 18,25,34 2001 Nice system. Swell softwarel 
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[ 1] Mon Aug 20 18,25,44 2001 Testing this leg thing. 
| 2] Mon Aug 20 18,25,48 2001 Can you read this"? 


上 人 述 两 个 程序 展示 了 如 何 使 用 Unix 域 socket 以 及 日 志 服 务 器 的 基本 思想 。 程 序 的 旋 
一 个 特征 是 实现 了 自动 追 如 功能 ,但 没有 使 用 〇 APPEND。 服务 器 接收 消息 ,然后 把 消息 
追加 到 文件 末尾 。 即 使 有 多 个 客户 同时 发 送 消息 ,底层 的 socket 机 制 会 负责 消息 的 序列 化 ， 


13.10 ”小结 socket 种 服务 器 


socket 对 于 进程 亲 的 数据 通信 是 强大 的 .万 能 的 工具 。 这 里 学 习 了 两 种 socket 和 两 种 
socket Hb hr. | 


域 
socket PF_INET OPEUNIX o 
SOCK STREAM E ERU, EE aL de 连接 的 ,本 地 
SOCK_DGRAM RE SEES: 数据 报 ; 本 地 


在 前 面 的 儿童 中 ,已 经 学 习 了 使 用 这 4 种 纸 合 中 的 3 种 socket 的 项 目 。 当 考虑 Unix 的 
”网 络 编程 和 准备 设计 自己 的 项 目 时 ,可 以 考虑 使 用 这 张 表 格 中 的 技术 ,根据 发 送 消息 的 类 
型 以 及 消息 发 送 的 距离 来 选择 最 佳 的 技术 。 


小 £8 


1, 主要 内 容 
数据 报 是 从 一 个 socket 发 送 到 另 一 个 socket 的 短 消 息 。 数 据 报 socket 是 不 连接 的 ， 
每 个 消息 包含 有 目的 地 址 。 数 据 报 (UDP)socket 更 加 简单 .快速 ,给 系统 增加 的 负荷 
更 小 ， 
许可 证 服务 器 是 用 来 对 被 许可 程序 实施 许可 证 验证 规则 的 。 许可 证 服务 器 发 布 许 
可 ,以 短 消 息 的 形式 发 送 给 客户 。 
许可 证 服务 圳 必须 记 住 哪个 进程 使 用 了 哪 张 票据 ,必须 维持 一 个 内 部 的 数据 库 。 因 
此 ,许可 证 服务 器 不 同 于 本 书 的 Web 服务器。 
* 记录 系统 状态 的 服务 器 必须 设计 成 可 以 处 理 服 务 器 和 和 客户 端的 朋 尝 事件 ， 
有 些许 可 让 服务 器 为 一 个 网 络 上 的 多 个 机 器 提供 服务 。 有 几 种 设计 方法 ,各 有 优 
socket 可以 有 了 两 种 类 型 的 地 址 ; 网 络 或 本 地 。 本 地 的 socket Bh hb m i Unix 域 
socket 或 名 字 socket。 这 种 socket 使 用 文件 各 作为 地 址 ,只 能 在 一 台 机 器 上 交 盾 
数据 。 

2， 于 一 步 的 工作 

本 章 学 习 了 两 种 服务 器 处 理 多 个 请 求 的 方法 。 许 可 证 服务 器 接收 数据 报请 求 ,并且 一 
次 一 条 地 返回 消息 。Web 服务 器 接收 数据 流 消 息 , 并 且 使 用 Cork 同时 应 管 所 有 请 求 。 服 务 
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器 有 另外 的 选择 ; 一 个 单一 进程 可 以 使 用 线程 的 技术 同时 运行 几 个 函数 。 下 一 章 将 学 习 有 
关 线 程 的 思想 和 技术 。 
3. 习题 | 


]3.4 


13.2 


13. 3 


13.8 


13.9 


13. 160 


在 使 用 流 socket B BITE rp ARS SEA Pe et ARA IS HIE PC HEURE. EE 
务 器 是 如 何 知道 给 哪个 地 址 的 客户 发 消息 的 ? 


进程 25915 是 如 和 何 战胜 进程 25914 得 到 票据 的 ? 考虑 每 个 客户 进程 的 创建 和 服 
务 咒 端 请 求 到 达 的 操作 序列 。 在 多 任务 系统 中 ,进程 恢 次 运行 。 进 程 在 哪儿 可 
以 被 中 断 从 而 得 到 测试 的 结果 ? 


如 何 使 用 一 个 许可 证 服务 器 处 理 2 个 或 更 多 的 程序 的 请 求 ?” 一 种 方法 是 恬 改 协 
议 使 得 每 个 请 求 包含 所 要 运行 的 程序 名 。 描 述 可 以 支持 多 程序 协议 的 数据 结构 
和 程序 逻辑 


当 服 务 器 正在 处 理 客户 请 求 时 ,如果 函数 ticket_reclaim RIAA. EE op Rd FU 
表 存 在 潜在 的 破坏 ? 考虑 函数 中 每 个 更 改 数组 和 计数 姻 的 地 方 。 在 哪 一 点 上 数 


组 的 状态 和 计数 器 的 值 不 一 致 ? 处理 函数 是 如 何 修改 数组 和 计数 器 的 ? uice i 


的 一 个 未 慰 测 的 改变 对 常规 处 理 图 数 有 何 影 响 ? 


当 进 程 被 创建 时 ,进程 ID 被 分 配给 进程 。 考 虑 下 商 的 时 间 序 列 : 一 个 进程 ID 为 
777 的 客户 得 到 票据 后 央 滤 了 了。 不久 ,一 个 不 同 的 用 户 送 行程 序 创 建 了 一 个 新 的 
进程 ,进程 ID f tae 777. 4 ticket_reclaim 种 序 运 行 时 , 它 发 现 了 进程 777. 
即使 现在 编号 为 777 的 进程 是 一 个 不 相关 的 程序 ,并 日 不 持 有 六 据 ,分 配给 原来 
进程 777 的 票据 也 不 能 皱 同 收 。 当 这 种 情形 出 现时 ,该 刀 何 处 理 ? 如 何 避 免 这 类 
事件 的 发 生 。 | 


一 种 防止 票据 数组 于 和 失 的 方法 是 服务 器 将 数据 写 到 磁盘 文件 中 。 如 兴 要 适应 这 
种 备份 机 制 ,该 如 何 改变 服务 器 ? 假设 客户 会 故意 杀 死 服务 器 以 得 到 更 多 的 票 
T ,那么 这 里 的 文件 备份 机 制 在 此 种 情形 下 该 如 何 工 作 ? 


持 有 早期 版 本 票据 的 客户 在 等 待 了 较 长 的 时 间 后 来 验证 票据 ,可 能 发 现 已 经 没 
有 更 多 的 可 用 票据 了 。 为 这 种 情形 设计 .种 应 管 , 使 得 客户 不 允许 继续 运行 , 因 
为 这 将 破坏 最 大 同时 运行 进程 的 数目 ,但 要 求 客户 不 能 突然 退出 ， 


参照 本 意 中 列 出 的 问题 ,比较 三 种 分 布 式 许可 证 服务 器 模型 . 


使 用 socket 时 ;可 以 用 write 和 sendto 来 发 送 数据 。 阅读 send 和 sendmsg 的 帮 
助手 由 ,后 面 两 个 芳 数 与 前 面 的 有 什么 区 别 ? 


轿车 管理 系统 与 数据 报 不 只 是 比喻 。 设 想 每 部 轿车 都 装 有 GPS 设备 。 一 个 计 
算 机 可 以 通过 modem 连接 到 Internet, 司 得 可 以 定位 轿车 的 位 置 。 设 想 轿 车 的 
启动 不 是 受 钥 匙 控制 ,而 是 通过 一 个 磋 卡 的 登录 来 控制 。 设计 一 个 允许 座 员 登 
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录 到 系统 来 使 用 轿车 HE EL ET Da n] EA ER E e] L7 RR RE DUE E EE B 
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更 改 程序 dgrecv.c, 要 求 不 仅 打 印 出 发 送 者 的 地 此 和 消息 接收 的 时 间 ,还 要 打印 
消息 编号 。 消 息 标 号 从 0 开始 。 和 希望 得 到 的 输出 如 下 : 


dgrecv,got a message ; testing 123 
from. 10.200.75.200.1041 

at :Sun Aug 19 10.22.27 EDT 2001 
msg ;23 


Àj dgsend. c 增加 客户 程序 dgrecv2. c, 


许可 证 服务 器 在 一 张 才 中 人 在 有 客户 拥 上 月 票据 的 信息 ， 旭 采 想 要 服务 种 打 印 这 
些 信 息 ,该 如 何 操作 ? 看 到 表 的 信息 有 助 于 排 错 或 测试 服务 器 。 一 种 标准 哆 和 
服务 器 通信 技术 是 使 用 信号 。 


更 改 程序 lserv] 使 得 它 在 接收 信号 SIGHUP 时 ,打印 出 表 的 内 容 。 可 以 通过 命 


4> kill — HUP serverpid 来 潮 试 该 特征 。 


更 改 许 可 证 服务 器 使 得 它 只 在 一 个 客户 的 请 求 被 拒 笔 时, 才 调 用 ticket. reclaim 
程序 。 该 方法 的 优 缺 总 各 是 什么 ? 


更 改 delnt2. c 程序 , 便 它 睡眠 5 秒 钟 后 验证 票据。 如 果 票 据 合 法 ,客户 再 睡眠 5 


秒 钟 ,然后 退出 并 归还 票据 。 如 朵 票据 不 合法 ,客户 尝试 请 求 男 - TED AR 


上 成功, 继续 正常 操作 。 如 果 和 失败 ,告诉 用 户 许 可 证 服务 器 出 错 然 后 再 退出 。 


更 改 前 面 章节 中 编写 的 shell EIRA bounce 程序 ,使 用 许可 证 服务 器 。 在 哪 增 
加 票据 验证 过 程 ? 当 服务 器 崩 演 时 ,票据 不 可 用 了 ,该 各 用户 说 什么 ? 


更 改 客户 服 务 器 代码 使 得 票据 包含 有 主机 IP 地 址 。 如 何 改变 票据 列表 ? 确信 
对 验证 函数 也 做 了 改变 。 


实现 三 种 分 布 式 许可 证 控制 模型 的 一 种 。 


日 志 系 统 的 -个 问题 是 其 中 的 请 息 都 挟 甘 名 的 ,更 改 该 系统 使 得 请 息 包 含 发 送 
消息 用 户 的 用 户 名 ， 


在 明志 服务 器 中 使 用 read, 编写 两 个 新 版 本 的 服务 器 ,一 个 使 川 recvfrom, S 
一 个 使 用 reev。 这 些 获 取 数 据 的 方法 有 何不 同 ” SPRAY BAER 
THE. 


An iT nf uE RR & RAA R Efi R] Unix 域 socket, 需 要 做 何 改变 ? 解释 客户 为 
什么 要 使 用 bind, 
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13.22 在 第 1 章 中 ,讨论 了 一 个 Internet 桥牌 游戏 。 在 任何 的 分 布 式 扑克 游戏 中 ,软件 
必须 模拟 一 个 扑 元 牌楼 ,以 确保 两 个 客户 不 会 持 有 相间 的 扑 和 元 。 
编写 -对 程序 cardd 和 cardc ,使 用 数据 报 来 处 理 一 氧 的 扑 兄 牌 。 司 动 时 服务 先 
洗 牌 , 接 下 来 客户 从 命令 行 启 动 ,就 可 以 从 服务 右 获 取 扑 克 牧 。 例 程 运行 如 下 : 
5 carde get 5 
4D AH 2D TD KC 


AUR ITE PARET 5 张 脾 ,-- 张 方块 4, 一 张 红 桃 AA,-- 张 方块 2,- 一 张 方块 10， 
RL, ARBRE EMBER RASA POL. HF ADIL BA RIA 
BH dealer AM ATH. 考虑 一 下 还 有 其 他 什么 有 用 的 事务 可 以 作为 协议 的 
IE? 


5. 项 目 


基于 木 章 的 肉 雁 ,可 以 学 习 编写 干 面 的 Unix 程序 ， 
talk rwho , M X KAR S 35 
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概念 与 技巧 

© 程序 的 执行 路 线 

* 多 线程 程序 

。 创建 及 销毁 线程 

- 使 用 互 斥 锁 机 制 拧 让 线程 间 数 据 的 安全 站 至 
”使 用 条 件 变 量 同 步 线程 间 的 数据 传输 

。 传递 多 个 参数 给 线程 

相关 的 系统 调用 与 函数 

* pthread create, pthread join 

* pthread mutex lock, pthread mutex unlock 


* pthread cond wait,pthread cond signal! 


14.1 同一 时 刻 完 成 多 项 任务 


不 知道 你 是 否 经 常会 被 一 些 充满 了 闪烁 .跳动 或 者 旋转 图 片 的 网 页 弄 得 很 不 舒服 ,不 寺 
我 确实 不 高 欢 它们 。 然 而 尽管 这 些 网 页 让 人 很 类 ,它们 却 引 发 了 一 个 技术 问题 ; 一 个 程序 如 
何 才 能 在 同一 时 刻 完 成 多 个 任务 呢 ? 

动 曾 图 片 并 不 是 惟一 可 以 完成 并 发 功能 的 Web BF. SRA RET P R a. E 
可 以 从 不 同 的 服务 器 上 下 载 并 且 解 压 纲 图 片 。 浏 览 器 并 行 地 完成 这 么 客 的 任务 ,而 非 一 项 
接 一 项 地 做 ,那么 它 又 是 如 何 同 时 下 载 并 解压 这 些 图 片 的 ? 

多 侍 务 系统 的 问题 在 本 书 中 早已 介绍 过 了 。 视 频 游 戏 那 一 章 , 使 用 计时 器 和 两 个 计数 
器 在 两 维 空间 中 控制 图 片 的 动作 。 其 他 的 章节 也 曾 用 fork 和 exec 创建 新 进程 的 方法 处 理 
并 发 程序 ,从 而 实现 一 个 Web 服务 器 的 功能 。 那 么 这 里 为 何不 用 这 种 方法 驼 ? 

书 中 曾 使 用 fork 和 exec 同时 运行 多 个 程 这 。 和 如 果 希 望 同时 运行 几 个 函数 ,或 者 同时 对 
一 个 苔 数 调 用 很 多 次 , 那 该 怎么 办 呢 ? 

本 章 将 介绍 线程 。 线 程 相 对 于 了 荡 数 就 类 似 于 进程 相对 于 程序 ,后 者 为 前 者 扣 供 了 运行 
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环境 。 很 多 函数 可 以 同时 运行 ,但 它们 都 在 相同 的 进程 中 。 

本 章 主要 的 项 自 是 完成 一 个 程序 让 文本 框 中 出 现 本 断 物 动 的 文字 。 这 里 将 先 修改 以 前 
的 那个 Web 服务 器 程序 ,让 它 不 启动 新 的 进程 即 可 处 理 访问 目录 列表 以 及 文件 内 容 的 并 发 
请 求 。 


14.2 函数 的 执行 路 线 


什么 是 线程 ? AMA? 又 如 何 去 创 建 它 呢 ? 首先 看 下 面 的 一 个 传统 的 程序 ,在 此 程序 
中 ,指令 一 条 接 一 条 的 顺序 执行 。 然 后 ,只 要 将 此 程序 做 两 个 小 的 改动 , 即 可 让 程序 并 行 的 
TAG PIT SAC. 


14.2.1 一 个 单线 程 程 序 


/* hello singie.c - a single threaded hello world program */ 


HK include < stdio, h> 
H define NUM 5 


maint} 
1 


void print msg(char * ); 


print msq(t "hello": 
priat msg(("worldin"); 
f 
void print msg(char * m) 
| 
ink i; 
for (i=0 ; i-—NUM ; itt)! 
printf((" € s", m); 
fflush(stdout); 
sleept1); 


t 


f£ hello single. c H, main PR SALE Hh be Al Y PSP R FE RIT r T ER. 
下 面 的 输出 结果 反映 了 程序 的 控制 流 ， 


$ cc hello single.c ~o hello single 
$ ./hello single 
helloheilohellohellohelloworid 
world | 

world 

world 


world 


: 
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上 面 的 每 一 行 输 出 之 间 都 有 一 个 1 秒 钟 的 时 延 , 程 译 共 运行 了 10 秒 。 殉 14.1 展示 了 此 
程序 的 执行 流程 ， 


n gai 





Eg 14.1 单 执 行路 径 


Bc TACT RARE A main KA Aa wt A BS print msg. #22, M print msg 中 返回 到 
main, 之 后 再 一 次 进 人 prim, msg HRHAHA_— KN BHM. EUST Sida uen. 
main 中 退回 , 

不 辣 断 地 跟踪 指令 执行 的 路 径 在 这 里 被 称 做 执行 路 线 (thread of execution) 。 传 统 的 程 

只 有 一 条 单独 的 执行 路 线 。 就 算是 包含 有 gota 语句 以 及 递归 子 程序 的 程序 也 只 有 一 条 执 
行路 线 ,尽管 这 条 路 线 有 时 有 些 弯 弯 绕 绕 . 


14.2.2 一 个 多 线程 程序 


如 果 想 同时 执行 两 个 对 于 print msg 晴 数 的 调用 ,就 像 使 用 fork 建立 两 个 新 的 进程 一 
FE PRE ZI? 这 种 思想 清楚 地 体现 在 图 14.2 rh. 


Ig apte fg 





“新 的 线程 
图 14.2 ”多 执行 路 名 的 程序 


首先 .一 条 执行 线路 进 人 main 隧 数 。 初 始 的 线路 新 建 了 一 条 新 的 执行 线路 来 运行 函数 
print_msg。 初 始 线 路 继续 执行 下 一 条 指令 从 而 新 建 了 男 一 条 线路 来 对 print. msg 函数 进行 
第 二 次 的 调用 。 最 后 ,初始 线路 等 待 两 条 新 的 线路 加 入 自己 ,再 从 main PRICE BL, 

人 们 无 时 无 刻 不 在 进行 着 这 种 多 线程 的 任务 管理 ， 如 果 父母 需要 做 许多 融 事 ,他 们 通 
Bat ELAF—-HE. X8ib—TBET9 4 xdc7.5—T249 T ZWEI. RIS 
等 两 个 孩子 都 回来 之 后 ,大 家 再 一 起 回 家 。 

一 个 线程 就 类 似 于 上 人 饮 中 大 父母 做 事情 的 一 个 孩子 。 如 果 想 同时 完成 许多 事情 ,最 好 
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多 带 几 个 孩子 . -起 去 ， 类 伺 地, 如果 --- 个 程序 希望 同时 执行 很 多 函数 , 它 必 须 创 建 多 个 线 
程 。 下 面 的 这 个 程序 hello multi. c 将 图 14. 2 的 思想 实现 了。 


/* hello multi.c — a multi- threaded hello world program x / 


# include «stdio.h 


# include —pthread. h> 


H define NUM 5 


maint} 


了 
^ 


pthread t tl, 12; /* twa threads »/ 
void * print msgívoid x }; 


pthread create(&tl, NULL, print msg, (void = )"hello"); 
pthread create(&t2, NULL, print msg, (void » )"worldin'); 
pthread join(tl, NULL); 

pthread join(t2, NULL); 


void * print msg(void * m) 


i 


} 


char * cp = (char *) m; 

int i: 

for(i-0 ; i<c NUM; itt }i 
printf(" $ s", m); 
fflush¢ stdout) : 
sleep(1); 

f 

return NULL; 


注意 一 下 此 程序 与 原先 那个 程序 的 区 别 。 首先 ,这 里 包含 了 一 -个 头 文 件 pthread. h E 
包含 了 数据 类 型 的 定义 和 跑 数 的 原型 。 其 次 ,程序 中 定义 了 pthread t 类 型 的 两 个 变量 英和 
t2。 这 两 个 线程 就 类 似 于 上 面 所 说 的 父母 办 事 时 所 带 的 两 个 孩子 。 

图 14.2 控制 流 中 的 每 一 个 分 支点 都 对 应 了 如 下 的 一 行 代码 : 


pthread create(&ti , NULL, print_msq, (void « )"hello") 


IH, iR A VE FA RB (DLP AC REGE “NG. BT FB hello 米 运 行 函数 print_msg。” 上 看 第 
一 个 参数 是 线程 的 地 址 ; 第 二 个 参数 是 指向 线程 属性 的 指针 ; 第 三 个 参数 是 所 要 执行 的 于 
数 名 称 ; 而 第 四 个 参数 则 是 指向 版 可 传递 给 薄 数 的 参数 的 指针 ， 

这 条 指令 使 用 指定 的 属性 新 建 了 一 个 线程 ,而 此 线程 使 用 参数 hello 来 运行 函数 


print, msg. 
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pthread_create(&t2, NULL, print_msg, (void x )"world\n") 


此 函数 也 使 用 默认 的 属性 创建 了 -- 个 新 的 线程 ， 新 的 线程 用 参数 world\n iz Tr AM 
print msg, | 

Ifi EK Y. pthread_join(t], NULL); Alt 2 8E SE PE EAT E SE E ,main 借助 于 此 函数 来 
AE PETS TER RTT AI), AE pthread join 使 用 了 两 个 参数 。 第 一 个 参数 是 所 要 等 
竺 的 线程 ,而 第 二 个 参数 则 是 一 个 指向 返回 值 的 指针 。 如 果 此 参数 为 NULL, o iR EHAA 
SE. 

pthread join(12, NULTO ; 表示 main PESE AE i 59 PRB, 

编译 此 程序 ,并 运行 ,输出 结果 如 下 ; 

$ cc hello multi.c - lpthread - o hello multi 

< ./hello multi 

helloworld 

helloworld 

helloworld 

helloworld 

helloworld 

$ 

此 程序 只 运行 了 5 秘 钟 ,因为 两 个 循环 并 行 的 执行 。 不 过 对 于 线程 调度 的 不 同 可 能 会 导 
致 输出 与 上 面 所 示 的 输出 不 同 。 太 家 可 能 已 经 注意 到 ,线程 的 使 用 是 多 么 的 灵活 。 在 这 里 
同时 运行 了 同一 个 函数 的 两 个 不 同 实例 ,仅仅 参数 是 不 同 的 。 当然 同时 运行 两 个 不 同 的 函 
数 了 出 是 -一 样 的 容易 ， 


14.2.3 相关 阔 数 小 结 


pthread create 


Hb 创建 一 个 新 的 线程 

ic 0e # include < pthread. h > 

HR m m int pthread, create €pthread 1 * thread, 
pihread aitr t & attr, 
void * ( x lunc) Cvoid * ) 
void * arg); 

ES. thread 指向 puhread i28 32 25 Bt BY 38 et 


atir -> 指向 pthread_attr_t Æ p EE ABE ,或 者 为 NULL 
iunc 指 间 新 线程 所 运行 图 数 的 指针 
arg 传递 络 [une 的 参数 


返回 值 成 项 返回 
errcode $jn 





«428 >» | Unix/Linux 编程 实践 教程 


一 一 一 一 — 


pthread create 图 数 创 建 了 一 条 新 的 执行 线路 ,在 此 新 的 线程 内 调用 了 funclarg). 新 线 
程 的 属性 由 attr 参数 来 指定 。func 是 一 个 函数 , 它 接收 一 个 指针 作为 它 的 参数 ,并 征 运 行 结 
束 后 返回 一 个 指针 。 参 数 和 返回 值 都 被 定义 为 类 型 为 void* 的 指针 LA RIF EN Baws 
型 的 值 。 

如 果 attr AA NULL, 线程 使 用 的 是 默认 的 属性 。 下 一 章 中 将 讨论 线程 的 属性 。 
pthread create 如 果 运 行 成 功 返 回 0, 和 否则 返回 一 个 非 零 错误 代码 。 


Pthread join 





AR 等 待 某 线程 终 上 
3 x9 # includ ude < ~pthread, hz 
ER A D 89 int Bibel qolnc O 4 thread. void * x retval) 
参数 thread 所 等 待 的 线程 
retval jE i A F EE EE E SER E 
3s [5] f o We SY P 
errcode 错误 


pthread join 使 得 调用 线程 挂 起 直至 由 thread 参数 指定 的 线程 终 儿 。 恕 果 retvai 不 是 
null ,线程 的 返回 亿 就 将 存储 在 由 revval 指向 的 变量 中 。 

当 线 程 终 止 时 ,pthread_join 函数 返回 0, 如 果 有 错误 发 生 , 则 返回 一 个 非 零 错误 代码 。 
如 果菜 线程 试图 等 竺 一 个 并 不 存在 的 线程 .多 个 线程 同时 等 待 一 MU LL cnet 
等 符 自 己 都 将 导致 函数 返回 一 个 错误 代码 。 

使 用 线程 进行 编程 就 像 给 一 些 人 赋予 不 同 的 任务 。 如 果 夺 强项 上 且 管 理 , 保 证 所 有 的 人 
都 能 够 按 序 办 事 ,不 和 别人 冲突 ,这 个 项 目 肯 定 会 提前 完成 。 下 面 将 介绍 可 以 使 线程 分 工 合 
作 的 技术 。 


14.3 ”线程 间 的 分 工 合作 


进程 间 可 以 通过 管道 ,socket、 依 号 .退出 /等 待 以 及 运行 环境 来 进行 会 语 。 线 程 间 的 通 
信也 很 容易 。 多 个 线程 在 一 个 单独 的 进程 中 运行 ,共享 全 局 变量 ,因此 线程 间 可 以 通过 设置 
和 读 上 这些 金 局 变量 来 进行 通信 。 不 过 要 知道 ,对 共 训 内 存 的 访问 可 是 线程 的 一 个 既 有 用 
义 极 为 危险 的 特性 。 


14.3.1 i L: incrprint. c 


/* incprint.c - one thread increments, the other prints «/ 


i include < stdio. h> 


# include < pthread.h-- 


# define NUM 5 
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int counter = 0; 


main() 

{ 
pthbread t tl; /* one thread «/ 
void * print count(void *); /# its function «/ 
int i; 


pthread create(&tl, NULL, print count, NULL); 
for(i = O0; i«NUM ; itt ){ 

counter tt: 

sleep(1); 
] 


pthread. yoin(tl, NULL); 
} 
void » print count(void » m) 
( 
int i; 
for (1=0 ; 1«NUM ; itt ){ 
printf("count = %* d\n", counter); 
sleep(1); 
) 
return NULL; 
) 


程序 incprin.c 使 用 了 两 个 线程 。 初 始 线程 执行 了 一 个 循环 来 使 计数 器 值 每 秒 钟 增 1， 
初始 线程 在 进入 循环 之 前 ,创建 了 一 个 新 的 线程 ; 新 的 线程 运行 了 一 个 函数 来 将 counter 的 
(ATT EDX. main 函数 和 print. count 函数 运行 在 同一 个 进程 中 ,所 以 都 有 对 于 counter 的 
访问 权 。 图 14. 3 展示 了 两 个 晒 数 和 全 局 变量 的 内 在 逻辑 。 





图 14.3 两 个 线程 共享 全 局 变量 


当 main MAY T counter (E 2/5 print counter 硝 数 立即 可 以 访问 到 新 的 值 ， 因 此 
并 不 需要 通过 管道 或 者 套 接 字 等 方法 传送 新 的 值 。 编 译 这 个 程序 ,然后 运行 它 ,结果 如 下 : 


5 cc incprint.c - lpthresd - o incprint 
$ ./inoprint 


* 430 * Unix/Linux 编程 实践 教程 


count = 1 
count = 2 
count = 3 
count - 4 
count = 5 


径 序 显然 可 以 正 贡 工作 。 -TAMER [5.5 —^7 BEES T ERA. 
这 个 例子 展示 了 如 何 使 运行 在 不 同 线程 中 的 沂 数 共享 全 局 变量 。 不 过 下 个 例子 还 要 有 有趣， 


14.3.2 例 2: twordcount. c 


很 多 学 生 都 有 这 样 的 经 验 ,对 着 电脑 数 自己 学 期 沦 文 的 字数 以 确定 字数 是 林 是 足够 。 
假设 一 个 学 生 有 一 篇 10 页 纸 的 论文 , 它 有 两 种 方法 来 计算 这 篇 文章 的 字数 .一 种 是 一 个 字 
一 个 字 地 数 了 10 页 纸 , 另 一 种 方法 是 找 10 个 同学 来 ,给 千 个 同学 一 页 纸 , 让 他 们 分 别 计算 
然后 将 结果 累加 起 来。 显然 并 行 地 计算 这 10 页 纸 的 字数 的 方法 会 快 很 多 - 

Unix 平 台 上 的 we 程序 的 作用 是 计算 一 个 或 多 个 文件 中 的 行 . 单 词 以 及 学 符 个 数 。 不 
过 wc 是 一 个 典型 的 单线 程 程序 。 人 怎样 夹 设计 一 个 多 线程 程序 来 计数 并 打印 两 个 文件 中 的 
所 有 字数 呢 ? 

" 版 本 1: 两 个 线程 一 个 计数 器 

第 一 个 版 本 程序 创建 分 开 的 线程 来 对 每 一 个 文件 进行 计算 。 所 有 的 线程 在 检查 到 单间 
的 时 候 对 同一 个 计数 器 增值 .多 14. 4 体现 了 这 个 思路 。 

一 个 进程 


一 个 计数 器 
两 个 线程 





图 14.4 两 个 线程 共享 一 个 通用 计数 器 
此 版 本 的 代码 包含 在 文件 twordcountl. c tF: 


/* twordcountl.c - threaded word counter for two files. Version 1 x/ 


# include «stdio. h> 
# include «Zpthread. h> 
t include <ctype. h> 


int total words ; 


main(int ac, char * av[ ]) 
{ 
pthread t tl, t2; /x two threads x/ 
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void * count words(void * Jj: 


if ( ac 1= 3 ){ 
printf( "usage: %s filel file2\n", av| 0 5; 
exití(i): 
| 
total words = 0; 
pthread create(&tl, NULL, count words, (void +) av[1]; 
pthread create(&t2, NULL, count words, (void * } av|2b; 
pthread join(tl, NULL); | 
pthread join(t2, NULL); 
printf(" % 5d, total words\n", total words); 
| 
void * count words(void * f) 
] 
char x filename = (char +} f; 
FILE * fp; 


int c, preve = 'XO'; 


if ( (fp = fopen(filename, "r"j)) T= NULL ): 
while( ( c = qetc(fp))!- EOF | 
if( T igalnum(c) && isalnum(prevc) ) 
total words ++ ; 
prevc = c; 
i 
fclose(fp); 
} else 
perror( filename) ; 
return NULL. 


| 


函数 count words 是 这 样 区 分 单词 的 : 凡是 一 个 非 字 母 或 数字 的 字符 跟 在 字母 或 数字 
的 后 面 ,那么 这 个 字母 或 数字 就 是 单词 的 结尾。 当然 这 种 思路 忽略 了 文件 的 最 后 一 个 单词 ， 
并 且 还 把 “U.S. A. "看 成 三 个 独立 的 单词 。 编 译 此 程序 并 按照 如 下 的 方法 进行 测试 : 


$ cc twordcountl.c - lpthread - o twcl 
5 ./twcl /etc/group /user/dict/words 
45614. total words 
Swe -w J/etc/group /usr/dict/words 
58 /etc/group 
45402 /user/dict/ words 
45460 total 


twordcountl 产生 的 结果 与 we 并 不 相同 ,因为 两 个 程序 对 于 单词 结尾 规则 的 定义 不 同 。 
这 里 还 有 一 个 比 单词 结尾 更 加 微妙 的 问题 : 所 有 线程 对 同一 个 计数 器 进行 操作 ,并 且 在 
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同时 进行 。 细 心 的 读者 也 许 会 问 : 这 样 会 不 会 有 问题 啊 ? C 语言 并 没有 指定 操作 total_ 
words 十 + 是 如 何 被 计算 机 执行 的 。 计 算 机 有 可 能 执行 的 是 这 样 一 个 操作 ; 


total words = total words + 1 


也 就 是 说 ,程序 先 将 计数 器 当前 的 值 存 人 寄存 器 中 ,加 1 操作 后 , 肯 将 其 恢复 到 内 存 中 。 

那么 如 果 所 有 线程 在 同一 时 刻 都 使 用 "取出 - 如 一 存储 ?的 序列 来 完成 对 计数 器 的 操 
作 , 结 采 会 如 何 呢 ? 

图 14. 5 所 示 的 是 所 有 线程 取出 同样 的 值 , 对 寄存 器 增 1 ,然后 再 恢复 新 的 值 。 两 次 增 1 
操作 同时 发 生 , 但 是 计数 融 的 值 只 能 一 次 一 次 的 增加 。 如 何 来 保证 线程 间 不 会 互相 干扰 对 
方 工 作 呢 ? 下 面 将 采用 两 种 办 法 进行 尝试。 | 


timc 
. Thread ] Thread Z 


: Fetal words get value trom variab.e 
» Yer value from varianle ST 
~ 





I 
| EGE add . cc value 
' aad 1 to value "p 
b Toez 
: 1231 
` Je slore in variable 
! store in vatisb.ie L- 


Y 
图 14.5 两 个 线程 对 同 … 个 计数 占 进 行 操 作 

”版 本 2: 两 个 线程 一 个 计数 器 ,一 个 互 斥 量 

大 家 注意 到 在 机 场 或 者 公交 车 终点 站 的 公共 存 情 柜 始 终 是 打开 的 ,除非 有 人 在 里 面 
存 了 东西 。 当 -… 个 大 扔 了 分 币 然后 拿 到 了 钥匙 之 后 , 便 设 有 别人 可 以 再 去 打开 那个 柜子 
了 了。 只 有 等 到 这 个 人 归还 了 和 钥匙 ,把 柜子 打开 之 后 ;其 他 人 人 才 可 以 再 去 使 用 。 类 似 地 ,如 
果 两 个 线程 需要 安全 地 共享 一 个 公共 的 计数 妖 , 它 们 也 需要 这 样 一 种 方法 把 变 最 加 锁 ， 

线程 系统 包 售 了 称 为 互 斥 锁 的 变量 , 它 可 以 使 线程 间 很 好 的 合作 ,避免 对 于 变量 . 晒 数 
以 及 资源 的 访问 冲锋 。 下面 的 程序 twordcount2. c HEPA RK fol SAGA E: 


/* twordcount2,c - threaded word counter for two files，#r 
fe version 2. uses mutex to lock counter */ 

# include < stdio. h> 

# include << pthread, h > 

H include < ctype. h> 


ant total words :; /* the counter and its lock #/ 


pthread mutex t counter lock = PTHREAD MUTEX INITTALIZER; 


main(int ac, char x av! |} 
i 
pthread t tl F t2: ix two threads xj 


void * count words(void + ); 


if ( ac!- 3 | 
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printf("usage; $s filel file2\n", av [0]; 
exit(1); 
) 
total words -[0]; 
pthread create(Stl, NULL, count words, (void *% ) avii]); 
pthread create(&t2, NULL, count «words, (void x» ) av[2]); 
pthread join(ti, NULL); 
pthread join(t2, NULL); 
printf(" % 5d. total wordsMn", total words); 
} 
void * count words(void s f) 
( 
char * Filename = (char *) F; 
FILE +» fp; 


int c, prevc = "'XO'; 


if ( (£p = fopen(filename, "x"))!= NULL 5| 
while( ( c = gete(fp)){= EOF ){ 
if ( | isalnum(c) && igalnum(prevc) ) { 
pthread_mutex_lock(&counter_lock) ; 
total words +t ; 
pthread mutex unlock(&counter, lock); 
) 


preve = c; 


) 
fclose(fp); 
) else 
perror(filename); 
return NULL; 
} 


此 程 夺 的 逻辑 类 似 于 图 14.6 PR, 
-NRR 细心 的 该 者 可 以 发 现 ,在 原来 的 程序 中 仅 仪 加 
一 个 计数 器 了 了 三 行 代 码 。 首先 定义 了 一 个 pthread_mutex_t 类 
型 的 全 局 变量 counter_lock, 然 后 赋 给 它 一 个 初 值 。 
Fa Th eR oh A) He A iat ZEAE Xt F count, words 89 38 fF K 
在 对 两 个 函数 pthread_ mutex_lock 以 及 pthread_ 
= mutex unlock 的 调用 之 间 。 
[See pee 3 现在 两 个 线程 可 以 安全 邮 共 享 计数 器 了 。 当 一 
^2 ER Wi] Fl pthread mutex lock & mf te. fi S& 5 — 
MC MTABRAMIFAR 。 个 线程 已 经 将 这 个 互 斥 量 锁 住 了 , 那 这 个 线程 只 好 阴 
PORE 塞 等 待 着 这 个 锁 被 另 一 个 线程 解 开 后 , 才 可 以 对 计数 







一 个 锁 
了 iS ETS ADM 
b j 


"pret IR m ETE 
E 
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RRITE, So ER PERL HEC DEPT PR IE JE RBIS AFR RE BR CUR TRIB Ah E E A jn 
任何 数目 的 线程 都 可 以 挂 起 等 待 互 斥 量 解锁 。 当 一 个 线程 对 互 矿 量 解锁 之 后 ,系统 就 

将 控制 权 交 给 等 候 的 其 一 线程 。 如 所 有 线程 都 按照 这 种 互 斥 原 则 进行 通信 时 , 王 斥 县 息 有 

用 的 ; 然而 如 果 一 个 线程 不 遵守 这 个 规划 ,直接 去 修改 计数 器 的 值 的 话 , 程 序 员 也 无 能 为 力 。 








pthread mutex lock 


























Hi ££ ER RRR RB UUERTERE 
oe j=  — #4ncludee¢ pthread ho 
函数 原型 | iut pthread mutex lock(pthread mutex t€ * mutex 7 
=š} 0 mee 指向 互 斥 锁 对 象 的 指 儿 mM 
= GERM mE 0 "PET. f mE 


erreade Anu 


pthread mutex lock E Wü BRAHE ERTE., WRERRBEHRH. TME, H 
DRM y HEX FRE AE 38. hu RR E Fe E OS 26 ES MRR BARA RHR RSS 
TRARRE. iu SR USER DDR P LGB UR ER OE SR JUL —M TRIE. 


pthread mutex unlock 


目标 i 5H B IRAN 
= AX" o lage pihrend hs i 
函数 原型 int pthread muiex unlock(pthread mutex t* mutex) 
/— $H mte — HAERSHENEU O 
te eee PERENNE: 


evrcode 错误 


pthread mutex unlock RRAREN RK RABE. MRA R E ERS ROAR ELE 
Pe -ARFER IRISI A A Pe A. A EIU. Ub p cB I8] OO. MGR — PIES 
HY fe EN E. 

AT EEG BA IER HTL. MSR — PR AE M FR RE OE E 
那 会 怎么 样 ? 如果 线程 企图 对 一 个 已 经 锁 住 的 互 斥 量 加 锁 呢 9 又 如 果 一 个 线程 还 没有 对 自 
已 锁 住 的 瑟 斥 其 解锁 就 退出 了 ;那么 结果 叉 会 如 何 呢 ? 不同 的 线程 系统 对 于 这 些 问 题 的 处 
理 方 法 各 不 相同。 详情 请 参见 你 所 使 用 的 Unix HES FR. 

是 否 需 要 互 线 量 ? 如 果 多 个 线程 企图 在 同一 时 刻 修改 相同 的 变量 ,它们 只 好 使 用 瑟 斥 量 
来 导 估 访 问 冲 帘 。 然 而 使 用 互 斥 量 使 得 程序 运行 速度 变 慢 。 对 所 有 文件 中 的 每 一 个 单词 都 
需要 执行 检查 ,设置 以 及 释放 锁 的 操作 ,这 使 得 程序 效率 低下 。 和 更 加 有 效 的 方法 是 为 每 个 线 
EREKCII 

。 版 本 3: 两 个 线程 .两 个 计数 器 .向 线程 传递 多 个 参数 

下 一 个 版 本 的 字数 统计 程序 为 每 个 线程 设置 了 自己 的 计数 器 ,从 而 避免 了 对 于 百 斥 量 
的 使 用 。 当 线程 返回 之 后 ,再 将 这 两 个 计数 回 的 值 加 起来 得 到 最 后 的 嬉 果 。 
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如 何 来 得 到 这 些 线程 的 计数 器 ? 你 如 何 使 线程 将 它们 的 计数 值 返 回 晶 ?在 一 个 通常 的 
单线 程 程序 中 ,字数 统计 画 数 将 得 出 的 字数 返回 给 它 的 调用 博 数 。 线 程 可 以 通过 震 用 
pthread exir 得 到 返 辐 值 ,这 个 返回 值 驻 可 以 通过 pthread_join 的 调用 被 原先 的 线程 得 到 。 
详情 可 以 参见 手册 。 下 面 将 使 用 一 个 稍微 简单 一 点 的 方法 。 

调用 线程 通过 传递 给 闸 数 一 个 指向 某 变量 的 指针 ,让 唔 数 对 此 变量 进行 操作 ,只 而 可以 
避免 让 线程 将 值 传 回 。 传递 指针 引发 了 -个 问题 ; 函数 pthread create 只 能 允许 传递 -个 
参数 给 明 数 ,而 文件 名 又 必须 传 给 图 数 , 孝 么 如 和 何 传 这 个 指针 呢 ? 办 法 很 简单 ,只 需 建 -- 个 
包 舍 两 个 成 员 的 结构 体 , 然 后 将 此 结构 体 的 地 址 传 给 晃 数 印 可 ， 


/* twordcount3.c - threaded word counter for two files. 
# - Version 3, one counter per file 


xf 


# include < stdio, hi> 
H include < pthread. h 
# include < ctype. hi> 


struct arg set | /* two values in one arg «/ 
char « fname; /* file to examine  +#/ 
int count; /* number of words */ 


ls 
main(int ac, char * av! D 


| 


pthread t ti, t2; /* two threads =,’ 
struct arg set argsl, arqs2; /* two argsets x/ 
void * count, wordsivoid « ); 


it ¢ acl= 3)! 
printf( "usage, %s filel file2\n", av#k[0]; 
exit(1); 

j 

argsl.fname = aví1]; 

argsl.count - 0; 


pthread create(&tl, NULL, count words, (void = ) &argsl); 


args2.fname - av[2]; 
argsZ.count = Q0; 


pthread create(&t2, NULL, count words, (void *) &arqs2); 


pthread join(tl, NULL); 
pthread join(t2, NULL); 
printf(" €&5d; $% s\n", argsl.count, av[1]): 

printf(" $ 5d, $ sin", args2.count, av| 2|}; 

printf(" $ 5d. total words\n", argsl.count + args2. count); 
! 


void * count words(void » a) 
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struct arg set * args = a; /*^ cast arg back to correct type «/ 
FILE » Fo; 
int c, prevc = 'XO'; 


if ( (fp = fopen(args- > fname, "r"))!- NULL ) | 
while( ( c = gate(fp))|= BOF ){ 
if ( | isaloum(c) && isalnum(prevc) ) 
args - count + 十 
preve = c; 
} 
Felose(fp) ; 
| else 
perror(args ~ > fname); 
return NULL; 
} 


这 里 通过 定义 一 个 以 文件 名 和 该 文件 中 字数 为 成 员 的 结构 体 解 决 了 同时 传递 两 个 参数 
的 问题 。main 函数 定义 了 两 个 这 种 类 型 的 局 部 变量 ,并 将 这 两 个 变量 的 地 址 传 给 线程 (如 图 
14. 7 所 示 )。 传 递 本 地 结 梅 体 指 舒 的 方法 孜 全 和 免 了 对 互 斥 量 的 依赖 ,又 消除 了 全 局 变量 ， 


一 个 进 径 


GE: ASTRA 





图 14.7 每 个 线程 都 所 有 一 个 指向 自己 结构 体 的 指针 


R$ Ux Val FI KA count, words 之 后 都 会 接收 到 一 个 指向 不 局 结构 体 的 指针 .因此 线程 从 不 
同 的 文件 中 读 取 信息 ,并 对 不 同 的 计数 器 进行 增 1 操作 。 因 为 结构 体 是 main 中 的 局 部 变量 ， 
所 以 分 配给 各 计数 器 的 内 存 空间 在 main BBR -ARFS . 


14.3.3 线程 内 部 的 分 工 合 作 : 小 结 


进程 的 数据 空间 包含 了 所 有 属于 它 的 变 芙 。 此 进程 中 运行 的 所 有 线程 部 拥有 对 这 些 变 
BVM RR. MRL RARE ABT RM ERIE ACOA. 

不 过 如 斥 进 程 中 的 任何 线程 侨 改 了 一 个 变量 值 , 所 有 使 用 此 变量 的 线程 必须 采用 某 种 
策略 来 避 钢 访问 冲突 。 在 某 一 时 刻 , 只 有 惟一 的 线程 可 以 对 变量 进行 访问 ， 

字数 统计 程序 的 三 个 不 同 版 本 显示 了 三 种 不 同 的 方法 来 进行 绕 程 间 的 变量 共享 。 在 
twordcountl. c 中 使 用 的 第 一 种 方法 ,允许 线程 无 任何 合作 来 修改 同一 个 变量 。 这 个 程序 本 
身 存 在 着 很 大 问题 。 
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程序 twordcount?. c 中 使 用 了 第 二 种 方法 。 这 种 方法 使 用 一 个 年 斥 对 象 来 保证 在 某 一 
时 刻 , 只 有 惟一 的 一 个 线程 对 计数 器 进行 修改 。 此 程序 虽然 解决 了 问题 ,但 是 由 于 对 设置 利 
释放 互 斥 锁 太 多 的 调用 导致 了 系统 性 能 的 降低 。 

twordcount3. c 中 使 用 的 第 三 种 方法 是 一 种 改进 的 方法 。 此 方法 为 每 一 个 线程 创建 了 
各 自 的 计数 器 ,这 样 避 免 了 共享 计数 器 的 麻烦 。 所 有 的 线程 不 需要 再 共 齐 一 个 变量 ,因此 也 
不 用 互相 合作 了 。 不 过 尽管 如 此 ,每 一 个 单独 的 线程 仍 需 和 原先 的 线程 进行 合作 。 特 别 地 ， 
原 线 程 不 应 在 其 他 线程 返回 之 前 读 取 它们 各 自 计数 器 的 内 容 。 在 这 种 情况 下 , 原 线 程 使 用 
pthread join 冰 数 使 自己 挂 起 直到 线程 已 返回 。 当 基 一 计 焉 线程 返回 的 时 候 , 对 于 pthread_ 
join 的 调用 激活 原 线程 ,允许 其 访问 计数 器 并 且 也 告诉 main BRETT Re Fa 
候 了 。 

第 一 个 版 本 的 程序 展 天 了 如 何 传递 卿 个 参数 给 革 一 线程 中 的 函数 ， 即 先 创 建 一 个 结构 
类 型 变量 让 它 包 含 所 有 的 参数 ,再 将 此 结构 体 的 地 址 传 给 函数 。 于 是 线程 可 读 取 或 修改 此 
结构 体 中 的 任意 成 员 变 量 了 。 任何 访问 此 结构 体 的 函数 都 可 以 看 见 值 的 不 断 变化 。 当 然 ， 
如 果 不 止 一 个 线程 需要 修改 这 些 值 的 时 候 , 就 又 得 异 助 于 车 不 量 来 避免 访问 冲突 了 。 


14.4 线程 与 进程 


Unix 从 其 产生 伊始 就 将 进程 作为 它 的 重要 组 成 部 分 而 线程 是 后 来 才 加 进去 的 。 进 程 的 
概念 非常 清晰 旦 统一 。 而 线程 却 有 善 一 系列 的 起 源 , 它 们 的 属性 也 各 不 相同 。 这 里 的 例子 
用 了 -一 个 叫做 POSIX 的 线程 接口 。 在 这 里 当然 忽 覆 了 效率 和 凋 度 的 问题 ,这 些 由 你 所 使 用 
的 Unix 版 本 和 线程 线 本 所 雇 定 。 

进程 与 线程 有 根本 上 的 不 同 。 每 个 进程 有 其 独立 的 数据 空间 .文件 描述 符 以 及 进程 的 

。 而 线程 共享 一 个 数据 空间 .文件 描述 符 以 及 进程 D。 下 面 这 些 概 念 对 于 程序 员 来 说 是 
SENE. 

(1) 共享 数据 空间 

这 里 考虑 一 个 在 存储 虎 中 存储 了 巨大 而 复杂 的 树 结 构 数 据 库 的 数据 库 系 统 。 儿 个 线程 
可 以 轻易 地 读 取 到 这 个 共享 的 数据 集 ， 窜 户 的 多 个 查询 可 以 由 一 个 进程 来 实现 。 如 果 变 量 
不 会 被 改变 ,上 共享 这 个 数据 空间 不 会 导致 什 何 问题 。 

再 考虑 一 个 使 用 malloc 和 free 杀 统 调用 来 管理 内 存 的 程序 。 一 个 线程 分 配 了 一 块 空间 
存 展 一 个 字符 串 。 当 此 线程 做 其 他 事情 的 时 候 , 另 一 个 线程 使 用 free ER IX T ix mM). 3B 
么 原先 的 线程 中 本 来 指向 此 空间 的 指针 现在 指向 了 一 块 已 经 被 释放 的 地 方 , 更 糟糕 的 是 ,这 
RIA CARI EB AAT. 

线程 机 制 还 会 带 来 内 存 的 园 积 。 程序 员 往 往 因 为 怕 影 响 了 某 线 程 正在 使 用 的 内 存 空 
间 , 只 分 配 而 不 释放 存储 区 域 。 这 直接 导致 了 内 存 的 圈 积 ,使 用 完毕 也 得 不 到 释放 ， 

在 单线 程 环 境 中 返回 指 问 静态 局 部 变量 的 指针 的 孙 数 无 法 兼容 于 多 线程 环境 。 因 为 
同样 

的 函数 可 能 在 多 个 线程 中 同时 被 调用 而 导 敏 结果 出 错 。 

简 而 言 之 ,如 果 共 享 的 变 基 很 洛 上 且 定 义 的 不 好 ,调试 一 个 多 线程 的 应 用 程序 将 会 是 收 梦 
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(2) SEXE WS OC PELIS TT 
在 fork 原 语 被 调用 之 后 ,文件 描述 符 自动 地 被 复制 ,从 页 子 进程 得 到 了 一 在 新 的 文件 描 
述 符 。 在 子 进程 关闭 了 某 一 个 从 父 进程 那里 继承 来 的 文件 描述 符 之 后 ,此 描述 答对 父 进程 
来 说 仍然 是 打开 的 。 

在 多 线程 程序 中 ,很 有 可 能 会 将 同一 个 文件 措 述 符 传递 给 两 个 不 同 的 线程 。 即 传递 给 上 

们 的 两 个 值 指向 同一 个 文件 措 述 符 ， 显然 如 果 一 个 线程 中 的 区 数 关闭 了 这 个 文件 ,此 
ME 

述 符 对 此 进程 中 的 任何 线程 来 说 都 已 经 被 关闭 。 然而 其 他 线程 或 许 仍 然 需 要 对 此 文件 

(3) fork,exec,exit, Signals 

所 有 的 线程 都 共 说 局 一 个 进程 。 如 果 一 个 线程 调用 了 exec. 系统 内 核 用 一 个 新 的 程序 
取代 当前 的 程序 从 而 所 有 正在 运行 的 线程 都 会 消失 ，。 并 且 如 果 一 个 线程 执行 了 exit. PAB 
个 进程 都 将 结束 运行 。 想 想 要 是 线程 的 运行 导致 了 内 存 段 异常 或 者 系统 错误 或 是 线程 般 
D EREET. MAER RERS T. 

fork 创建 了 一 个 新 的 进程 ,并 把 原 调 用 进程 的 数据 和 代码 复制 给 这 个 新 的 进程 。 如 果 
线程 中 的 某 却 数 调用 了 fork ,那么 其 他 的 线程 是 不 足 也 会 被 复制 给 新 的 进程 呢 ? 答案 是 否定 
的 ,只 有 调用 fork 的 线程 在 新 的 进程 中 运行 。 试 想 一 下 如 果 在 fork 发 生 的 时 刻 , 另 一 个 线程 
正在 修改 数据 , 那 结果 如 和 何 呢 ? 在 什么 情况 下 这 些 数 据 会 被 复制 到 新 的 进程 中 呢 ? 

信号 量 (Signal) 的 使 用 要 比 线程 复 染 多 了 .进程 可 以 接收 任何 种 类 的 信和 号 量 ,那么 哪 
些 线程 可 以 收 划 信号 量 ? 是 不 是 所 有 线程 都 可 以 呢 ? 如 果 这 些 信号 量 是 由 内 存 段 异常 或 系 
统销 误 引 发 的 又 将 如 和 何 ?线程 与 信号 量 的 细节 可 参考 Unix 的 使 用 手册 ， 

(4) 动手 做 一 做 

这 一 章 介 绍 了 线程 的 基本 知识 .主要 问题 以 及 多 线程 程序 设计 细节 。 对 于 这 一 章 的 最 
好 的 练习 就 是 对 于 同一 个 间 题 没 计 两 种 不 同 的 解决 方案 ,一 个 使 用 线程 , 舅 一 个 使 用 进程 。 
肯 看 一 看 嘟 一 个 容易 设计 ,编码 以 及 调试 ; 哪 一 个 运行 的 快 一 些 ; 万 一 个 又 更 适用 与 兼容 
Unix 的 各 种 版 本 呢 ? 


14.5 ARBAB 


再 看 一 下 上面 的 多 线程 字数 统计 程序 。 假 设 你 是 一 个 大 城市 选举 的 负责 人 人 。 城 市 中 小 
一 点 的 选区 很 饼 就 完成 了 统计 票数 的 工作 ,然而 你 却 要 等 到 所 有 的 数字 都 出 来 之 后 才能 宣 
布 这 个 重要 的 结果 。 不 过 你 希望 在 每 个 选区 票数 出 来 之 后 立即 可 以 看 到 结果 。 

在 文件 中 统计 数字 就 像 是 选区 统计 票数 一 样 。 有些 文件 比较 大, 因此 就 需要 较 长 的 时 
则 来 做 统计 。 看 一 看 如 果 下 面 的 命令 被 运行 后 ,结果 是 什么 样 的 : 


twordcount really- big- file tiny- file 


原 线 程 使 用 pthread wait 来 等 候 第 一 个 和 第 二 个 线程 返回 。 在 这 个 例子 当中 ,统计 第 
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一 个 文件 要 比 第 二 个 文件 的 时 间 长 的 多 。 那 么 在 第 二 个 线程 完成 之 后 ,如何 来 通知 原 线 
程 呢 ? 

一 个 线程 是 如 何 与 另 一 个 线程 互 道 消 息 的 呢 ? 在 一 个 计数 线程 完成 任务 之 后 , 它 是 如 
何 通知 原 线程 它 的 结果 已 经 产生 了 呢 ?” 对 于 进程 来 说 , 当 子 进程 终止 后 ,系统 调用 wait ik 
回 。 是 不 是 对 于 线程 的 处 理 也 有 类 似 的 机 制 呢 ?” 某 个 线程 是 否 也 可 浴 等 待 其 他 线程 完成 ? 
答案 是 否定 的 。 线程 匹 法 按照 这 种 方法 工作 。 因 为 对 于 线程 而 言 并 没有 父 线 程 、 子 线程 的 
概念 ,因此 并 不 存在 某 一 个 明显 的 线程 可 以 去 通知 。 


14.5.1 通知 选举 中 心 


某 选 区 完成 计 票 后 ,将 其 结果 发 送 给 管理 中 心 看 一 下 下 面 的 这 个 方法 ,此 方法 是 用 来 从 
选区 得 到 选票 ,然后 将 其 发 送 给 管理 中 心 ( 也 许 看 起 来 有 些 击 怪 , 不 过 线程 确实 就 是 用 这 种 
方法 来 与 另外 的 事件 互通 消息 ) 。 

(OD 在 选举 中 心 有 一 个 投递 选举 报告 的 邮箱 。 这 个 邮箱 在 某 一 时 刻 只 能 接收 一 份 票数 
报告 。 

此 邮箱 前 有 一 而 旗帜 . 它 可 以 被 升 起 来 .但 很 快 就 会 被 恢复 至 原 位 。 

(2) 选举 中 心 等 入 这 面 旗帜 升 起 来 ， 

(3) 其 选区 负责 人 将 选区 统计 结果 放 人 闻 箱 中 、 

(A) 某 选 区 负责 人 将 邮箱 的 旗帜 升 起 (发 送信 号 ) 。 

(5) 选区 中 心 看 到 斌 可 升 起 来 了 , 便 执行 下 列 步 又 ， 

从 邮箱 中 取出 选区 的 统计 报告 ， 

© 处 理 此 统计 报告 ， 

。 回 到 原来 的 地 方 继续 等 待 , 即 循环 转 至 步骤 (2)。 

上 面 的 策略 起 补 看 起 来 有 些 古 怪 , 但 确实 很 有 和 有 意义。 发送 方 将 数据 存 人 容器 中 ，, 然 

后 升 起 一 面 族 申 来 通知 接收 方 数据 已 经 准备 好 了 。 

图 14. 8 清楚 地 展现 了 选举 中 心 与 两 个 选区 之 间 的 关系 。 每 一 个 选区 将 自己 的 报告 放 人 
邮箱 中 ,然后 通 贡 选举 中 心 来 取 。 最 后 选举 中 心 处 理 了 报告 。 在 这 个 例子 中 升旗 帜 的 技术 
术语 叫做 发 送信 号 , 即 接收 方 在 等 竺 信号 的 到 来 。 当 然 , 这 里 只 是 个 比喻 ,对 旗帜 的 操作 与 
Unix 里 的 信号 量 机 制 一 点 关系 也 没有 ,两 者 仅仅 是 基本 思路 相同 而 已 。 





eser ERI 选区 2 
图 14.8 使 用 加 锁 的 邮箱 来 传递 数据 
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了 从 图 14. 8 中 还 可 以 看 到 另外 一 样 东 西 : 邮箱 上 有 一 把 锁 。 邮 逢 仅仅 可 以 容纳 一 人 纷 报 
告 , 因 此 在 某 个 时 刻 只 能 有 一 人 拥有 对 邮箱 访问 的 权限 。 昌 然 锁 的 加 入 使 邮箱 结构 看 起 来 
有 些 复 杂 ,但 却 使 得 邮箱 相当 可 靠 。 使 用 锁 机 制 的 邮箱 系统 ,其 完整 的 过 程 如 下 。 

C1) 选举 中 心 建 一 个 投递 选举 报告 的 邮箱 。 

此 邮 知 在 某 个 时 刻 只 能 容纳 一 份 选举 报告 。 

此 邮箱 旁 有 一 画 旋 帜 , 它 可 以 被 升 起 来 ,但 很 快 就 会 被 恢复 至 原 位 。 

此 邮箱 有 一 把 互 斥 的 锁 , 可 以 被 锁 住 或 打开 。 

(2) 选举 中 心 将 邮箱 锁 打 开 , 然 后 等 待 旗帜 信号 的 到 来 。 

某 选 区 负责 人 等 在 邮箱 口 ,直到 它 可 以 将 邮箱 锁 住 。 

如 果 邮 箱 非 空 ,选区 负责 人 先 将 邮箱 锁 打 开 , 等 待 着 旗帜 信 号 的 到 来 ,然后 再 将 邮箱 
锁 住 。 

选区 负责 人 将 选举 报告 放 人 邮箱 中 。 

(3) 选区 负责 人 将 旗 申 升 息 , 把 信和 号 发 出 去 。 

选区 负责 人 把 邮箱 上 的 锁 打 井 。 

(4) 选举 中 心 看 到 旗帜 信和 号 ,停止 等 待 。 

选举 中 心 锁 住 邮箱 。 

EG EP RE EE HR i eH 

选举 中 心 钼 理 该 选举 报告 。 

选举 中 心 升 起 旗帜 ,以 防 其 一 选区 负责 人 已 经 等 待 了 很 久 。 

选举 中 心 转 向 步骤 (2)。 


14.5.2 使 用 条 件 变 量 编写 程序 


下 面 将 计算 投票 数 昌 的 系统 转换 成 宁 数 统计 的 程序 。 计 票 系 统 使 用 了 -种 设备 : 容器 、 

旗帜 和 锁 。 这 三 种 不 同 的 设备 对 应 了 线程 编程 中 的 三 项 : 一 个 变量 保存 数据 .一 个 条 和 件 
对 象 和 一 个 互 斥 量 。 图 14. 9 展示 了 三 个 线程 和 三 个 变量 。 一 个 变量 用 作 指 向 字数 计数 兹 的 
指针 ,一 个 变量 用 作 条 件 对 象 ,而 另 一 个 变量 用 作 互 斥 量 。 

研究 一 下 程序 的 内 在 逻辑 。 原 绕 程 启动 了 两 个 计数 线程 然后 开始 等 待 结果 的 到 米 。 特 
别 地 ,点 线程 调用 pthread cond wait BAR SR MAR”. KPARAASRAB 

当 某 一 计数 线程 完成 计数 后 ,此 线程 通过 把 指针 存 人 “邮箱 ”变量 的 方法 来 传递 结果 。 
首先 ,此 线程 对 此 邮箱 加 锁 ; 然 后 线程 性 查 邮 箱 ; 如 果 上 邮箱 非 空 ; 线 答 把 邮箱 镇 打 于 并 等 待 着 
信号 的 到 来 ;之 后 ,线程 肯 一 次 把 邮箱 锁 住 ,并 把 结 采 放 入 邮箱 ;最 后 ,计数 线程 调用 了 函数 
bthread_cond_signal ,将 条 件 变量 flag ix pii ^ EE "GELS, 

此 时 由 于 执行 pthread cond wait 而 挂 起 等 待 条 件 变 量 flag 变化 的 原 线程 被 计数 线程 
发 出 去 的 信和 叶 聊 醒 了 。 蛛 线程 急切 地 和 想 冲 过 去 打 井 邮箱 , 然 测 此 时 的 邮箱 仍然 被 计数 线程 
Sic. 

当 计 数 线 程 通 过 调用 pthread_mutex_unlock 把 邮箱 锁 打 开 之 后 , 原 线 程 终于 得 到 了 对 
这 把 锁 的 控制 收 。 原 线程 将 选举 报告 从 邮箱 中 拿 出 来 ,在 屏幕 下 显示 出 来 ,再 将 其 加 到 总 数 
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图 14.9 用 加 锁 的 变 基 机 制 来 传递 数据 


中 去 。 然 后 原 线程 发 出 信号 ,以 防 别 的 计数 线程 正在 等 待 。 最 后 原 线程 循环 回去 ,继续 调用 
pthread, cond, wait 函数 ,自动 将 互 斥 量 解锁 ,并 将 自己 挂 起 直到 下 一 次 的 信号 到 来 。 

上 面 一 段 所 讨论 的 步骤 恰好 对 应 于 投票 系统 的 原型 .也 同样 对 应 于 下 面 将 看 到 的 
twordcount4. c PHR S: 


/* twordcount4.c - threaded word counter for two Files. 
# - Version 4: condition variable allows counter 
* tuncEions to report results early 


N 


E include < stdio.h— 
# include < pthread. h> 
B include <ctype. h> 


struct arg set ( /* two values in one arg ¥*/ 
char » fname: /x file to examine 4/ 
int count; /* number of words x/ 


|j 

struct arg set x mailbox; 

pthread mutex t lock = PTHREAD MUTEX_INITIALIZER; 
pthread cond t flag = PTIIREAD COND INITLALIZER; 


main(int ac, char » av[ }) 


{ 


pthread_E t1, t2; /* two threads «/ 
struck arg set argsl, args$2; /* two argsets «/ 
vord * count words(void « ); 


int reports in = 0; 


, 


Oooo CG 人 CC Tadd Ce ee ee "ol 


s. 442 « Unix/Linux gf Sc gk dfe 


| 


ar rr —ÓÓÓÓ a P 


int total words = 0 


if ( acf= 3 9| 
printf("usage; $s filel file2Xn", av i£ [0]; 
exit(1); 
i 
pthread mutex lock(&lock); /* lock the report box now «/ 


argsl. fname = av[ 1]; 
argsl.count = Q; 


pthread create(&tl, NULL, count words, (void + ) &arqs1); 


args2.fname = av[2]: 


Ù- 


Li 


argsé. count 


pthread create(&t2, NULL, count words, (void * } &args2); 


while( reports in <i 2 )! 
printf( "MAIN: waiting for flag to go upin"); 
pthread cond waitt&flag, Block); /* wait for notify */ 
printf("MAIN. Wow! flag was raised, I Wave the lockin'5 ， 
printf("% 7d; * s\n", mailbox- “count, mailbox- > fname); 
total words += mailbox- —count; 
if ( mailbox == &argsl? 
pthread join(tl,NULI.); 
if ( mailbox == &ardgs2) 
pthread join(t2,NULL); 
mailbox = NULL; 
pthread cond signal(Ssflag); 
reports in t; 
! 
printf("& "d, total words\n", total words); 


void x count words(ivoid + a) 


| 


struct arg set *args = a; /* cast arg back to correct type */ 
FILE x tp; 
int c, preve = ‘"\0': 


if € (fp = fopentargs - fname, "r"))!- NULL }{ 
while( ( c = getc(fp})'= EOF ){ 
if ( ! isalnum(c) && isalnum(prevc) ? 
args 一 count ++ - 


preve = c; 


Ld 
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fclose(fp); 
j else 

perror(args - fname); 

printf( "COUNT; waiting to get lock\n"); 
pthread mutex lock(&lock); /* get the mailbox */ 
printf("COUNT, have lock, storing data\n") ; 
if € mailbox!z NULL ) 

pthread cond wait(&flag,&lock): 

; 


mailbox = args: /* put ptr to our args there x; 


printr( "COUNT: raising flag\n"); 


pthread cond signal(&flag); /* raise the flag */ 
printf( "COUNT. unlocking box\n") >; 

pthread mutex unlock(&lock); /* release the mailbox x/ 
return NULL; 


下 面 的 运行 显示 了 时 间 的 发 生 顺 序 : 


5 cc twordcount4.c ~ lpthread -ao twed 

S ./twc4 /etc/group /usr/dict/words 

COUNT; waiting to get lock 

MAIN, waiting for flag to qo up 

COUNT; have lock, storing data 

COUNT, raising flag 

COUNT. unlocking box 

MAIN. Wow! Flag was raised, I have the lock 
195. /etc/group 

MAIN. waiting for flag to go up 

COUNT; waiting to get lock 

COUNT. have lock, storing data 

COUNT. raising flag 

COUNT; unlocking box 

MAIN; Wow! fiag was raised, I have the lock 
45419, /usr/dict/words 

45614. total words 


14.5.3 使 用 条 件 变量 的 函数 


在 邮箱 上 用 来 通知 其 他 线程 的 旗帜 就 是 一 个 条 件 变量 。 下面 函数 的 作用 就 是 使 用 条 件 
变量 进行 通信 。 
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pthread cond wait 


目标 使 线程 挂 起 ,等 待 某 条 件 变量 的 信号 。 
3px H include < pthread, h> 
Ba E Im E int pthread cond wait (pthread cond t # cond, 


pthread mutex t * mutex); 


eR cond f& (ot E: A dp AE HE A FS E 
mutex $8 n] 8 Fe BER BOTHE 


3& [5] {i 0 成 功 返 回 
errcode 错误 


pthread cond wait 使 线程 挂 起 直到 另 一 个 线程 通过 条 和 作 变量 发 出 消息 。，pthread_cond 
wait 画 数 总 是 和 互 斥 锁 在 一 起 使 用 。 此 函数 先 和 目 动 释放 指定 的 锁 , 然 后 等 待 条 件 变 其 的 变 
化 。 如 果 在 调用 此 羡 数 之 前 , 扭 斥 量 mutex 并 没有 被 锁 住 ,图 数 执行 的 绪 果 是 不 确定 的 .在 
返回 原 调 用 函数 之 前 ,此 旺 数 自动 将 指定 的 互 线 量 重 新 锁 住 。 


pthread cond signal 


目标 晚 配 一 个 正在 等 候 的 线程 
头 文 忻 it include x us. hc 
函数 原型 int Diecadosond sinat br area E * cond); 
|» — £$8 cond 指 向 EXER BBE ü E 
返回 什 0 成 功 返 回 
errcode TH EA 


pthread cond signal py tah DATE Gt cond Xd o. AAR SRI ASA 
会 发 生 ; 若 是 多 个 线程 都 在 等 竺 ,只 吃 醒 它们 中 的 一 个 ， 


14.5.4 EF] Web 服务 器 例子 


通过 前 面 的 学 习 , 大 家 已 经 了 解 了 POSIX 线程 系统 最 基本 知识 和 技 三 ,包括 如 何 创建 新 
的 线程 ,如何 等候 线程 返回 .如 何 安 全 地 在 线程 间 共 享 数 据 以 及 比 程 如 何 与 其 他 线程 互通 消 
息 。 相 信 大 家 已 经 有 足够 多 的 知识 可 以 完成 Web 服务 器 与 复杂 动画 的 制作 。 


14.6 多 线程 的 Web 服务 器 


新 面 的 章节 已经 与 了 一 个 Web 服务 髓 的 程序 。 服 务 器 使 用 fork 系统 调用 创建 新 的 进 
He FE ib BRP ATER. Web 服务 器 需要 抑 成 三 种 操作 :将 目录 列表 返回 ;将 文 任 内 容 返 
PTs ELE CGI 程序 的 输出 返回 。 

服务 惟 需 要 新 的 进程 来 运行 CGI 程序 ,但 是 并 不 需要 新 的 进程 来 读 取 上 月 录 列 表 和 文件 
AF. | 
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14.6.1 Web 服务 器 程序 的 改进 


这 里 对 前 -- 个 版 本 的 Web 服务 占 程 序 作 了 很 多 修改 。 最 重要 的 是 使 用 肾 数 pthread_ 
create #44 J fork。 在 新 的 版 本 中 客户 端的 请 求 不 再 由 单独 的 进程 来 处 理 , 而 是 由 同一 进程 
的 多 个 线程 来 处 理 。 

另 外 还 做 了 两 个 改动 :首先 , 移 除 了 CGI 的 功能 。 后面 的 章节 会 把 这 个 功能 加 上 去 。 其 
次 ,自已 写 了 一 个 对 有 只 梁 进 行列 表 的 丽 数 ,而 以 前 的 版 本 是 通过 调用 exec 执行 标准 1s 命令 来 
完成 对 上 且 录 的 列表 的 。 


14.6.2 在 多 线程 的 版 本 允许 一 个 新 的 功能 


多 线程 的 特性 允许 我 们 浴 加 一 个 新 的 功能 :内 部 统计 。 服 务 器 的 运行 者 通常 希望 知道 
服务 器 的 运行 时 间 .接收 的 客户 端 请 求 的 数 日 以 及 发 送 加 客户 端的 数据 量 。 

因为 对 于 所 有 的 请 求 共享 内 存 空 间 , 可 以 使 用 共享 变量 的 方式 来 进行 统计 。 那 么 用 户 
如 何 访 问 这 些 统计 数据 呢 ? 这 里 加 入 一 个 特殊 的 URL: status。 当 远程 用 户 请 求 此 URL 
时 ,服务 器 将 内 部 的 统计 数据 发 给 客户 站 。 


14.6.3 PEP (Zombie Threads) :独立 线程 


现在 来 考虑 另 一 个 技术 细节 。 本 章 中 所 提 到 所 有 的 程序 中 都 使 用 了 pthread_join RA 
来 等 待 线程 返回 。 每 个 线程 都 占用 了 系统 资源 。 如 果 程 序 员 忘 记 使 用 pthread_join 来 收回 
线程 ,这些 被 线 释 所 占用 的 资源 就 无 法 被 回收 ,次 似 于 用 malloc 米 分 配 的 空间 部 没有 用 free 
释放 掉 -- 样 。 

在 字数 统计 的 程序 中 , 原 线程 不 得 不 等 待 所 有 的 计数 线程 返回 之 后 , 才 可 以 收集 数据 。 
然而 Web 服务 器 却 设 有 理 用 等 竺 处 理 请 求 的 线程 返回 。 困 为 原 线程 不 需要 从 这 些 线程 得 到 
任何 返回 数据 。 

这 里 同样 可 以 创建 不 需要 返回 的 线程 , 称 之 为 独立 线程 (Detached Threads)。 当 图 数 执 
行 完毕 之 后 ,独立 线程 日 动 释放 它 所 占用 的 所 有 的 资源 ,它们 自身 甚至 也 不 允许 等 待 其 他 的 
线程 返回 。 可 以 通过 传递 一 个 特殊 的 属性 参数 给 贞 数 pthread_crcate 来 创建 一 个 独立 线程 ， 

/* creating a detached thread */ 

pthread t t. 

pthread attr t attr detached; 

pthread attr init(&attr detached); 


pthread attr setdetached(&attr detached,PTHREAD CREATE DETACHED): 
pthread create(&t,&attr detached,func,arg); 


14.6.4 Web 服务 器 代码 
采用 多 线程 方法 实现 Web 服务 器 的 完整 代码 如 下 ， 


/* twebserv.c — a threaded minimal web server (version 0.2) 
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* usage; tws portnumber 


* features. supports the GET command oniy 


x runs in the current directory 
* creates a thread to handle each request 
x supports a special status URL to report internal state 


* buiidinq, cc twebserv.c socklib.c - lpthread - o twebserv 


«fl 


H include <_stdio. h> 
# include <sys/types.h> 
+ include <i sys/stat. h 


# include < string. h> 


# include << pthread. h>> 
# include < sted] ib. ho 
# include «unistd.h- 


H include < dirent. h= 


# include < time. h> 
/* gerver facts here x/ 


time t server started ; 
int server bytes sent; 


int server requests: 


main€int ac, char x avj : 
1 
int sock, fd; 
int x fdptr; 
pthread t worker; 
pthread at&ttt; 


void # handle call(void +); 


if ac 521 }f 
fprintf(stderr, "usage; tws portnumXn") ; 
exit(1) - 

j 


sock = make server sSocket( atoi(av|1]|) )- 


if ( sock == - 1) 1 perror( "making socket"); exit(2); | 
setupl&attr) > 
/* main loop here, take call, handle call in new thread +/ 


whilec1)4! 
fd = accept( sock, NULL, NULL); 


server requests ++. 


oo — o . 


fx 
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fdptr = malloc(sizeof(int)?; 
* fdptr 三 fd; 
pthread create(&worker,&attr,handle call,fedptr); 


* initialize the status variables and 


* set the thread attribute to detached 


«/ 


setup(pthread attr t * attrp) 


{ 


} 


pthread attr init(attrp); 
pthread attr setdetachstate(attrp,PTHREAD CREATE DETACHED); 


time(&server started). 
Server requests - 0; 


server bytes sent = 0; 


void * handle callivoid » fdptr) 


i 


i* 


FILE x fpin; 
char request| BUFSIZ}- 
int fd: 


F 


fd = *(int # }fdptr; 
free(fdptr) ; /* get fd from arg «/ 


fpin = fdopen(fd, "r"); /* buffer input x/ 
fgets(request,BUFSIZ,fpin); /* read client request */ 
printf("got a call on $d; request = %s", fd, request}; 
Skip rest of header(fpin); 


process rqtrequest, fd); /* process client rq */ 


fclose(fpin); 


skip rest of header(FILE +) 
Skip over all request info until a CRNL is seen 


skip rest of header(FILE * fp? 


{ 


charbuf[ BUFSIZ ;= |，， 


r 


while( fgets(buf,BUFSIZ,fp) |= NULL && strcmp(buf, "\r\n,") 
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process rqt char * rq, int fd } 

do what the request asks for and write reply to fd 
handles request in a new process 

rq is HTTP command, GET /foo/bar.html HTTE/ 1. 0 


mem emi c MENU NN, ID nm ee "sii Wipe j. SE SS aa a Se eem m c s mmi, comm, d Ws: 


process rq( char * rq, int fd) 


{ 


} 


char  cmd|BUFSIZ!, arg[ BUFSIZ |; 


一 f 


if ( sscanf(rq, ,"*s%s,", cmd, arg) [= Z) 
return; 
sanitize(arg); 


printf("sanitized version is * s\n", arg); 


if ( strcmp(emd, "GET"5) |= 0) 
not implemented(): 

elge if ( built in(arg, fd) ) 

else if ( not exist( arg) ) 
do 404(arg, fd); 

else if ( isadir( arq ) } 
do ls( arg, fd}; 

eise 


do cat( arg, fd); 


ix 


* make sure all paths are below the current directory 


x / 


sanitize(char * str) 


1 


char x sre, * dest; 
src = dest = str; 


while( x src ){ 


if ( strncmp(src, "7 /". 4) ==0) 


sre += 3; 
else if ( strnomp(src,"//",2) ==0 ) 
sret+ ; 


else 
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x dest++ = ssrctt: 
| 
x dest = ,'\O0,'; 
if ( *str == '/' Jj 


strcpy(str,str + 1); 


if € str[0 ; == 'NO' i| stremp(str,"./")-=0 
|| stremp(str,". /.,. "3 ==0 ) 


strcpyCstr, ". "); 


/* handle built - in URLs here. Only one so far is "status" x/ 
built in(char «arg, int fd) | 
í 

FILE + fp: 


if ( stremp(arg, "status ") !- 0) 
return 0 : 


http reply(fd, &fp, 200, "DK", “text/piain", NULL); 


fprintf(fp,"Server started, s", ctime(&server_started)); 
fprintf(fp,"Total requests. * d\n", server requests); 
fprintf(fp," "Bytes sent out, $ din", server bytes sent); 
fclose(fp) ; 


return 1; 


http reply(int fd, FILE «x * fpp, int code, char * msg, char * type, char * content) 
1 

FILE * fp  fdopen(fd, "w"); 

int bytes = 0; 


if C fp |= NULL )/ 


bytes = fprintf(fp,"HTTP/1.0 $d *sXrXn", code, msg); 


bytes t= fprintf(fp,"Content- type, %s\r\n\r\n", type); 
if ¢ content 3 
bytes += fprintf(fp," & s\r\n" 


, content) ; 


f 

fflush(fp); 

if ( fpp ) 
*fpp = fp; 

else 
fclose(fp}: 


return bytes: 
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simple functions first; 
not implemented(fd) ^ unimplemented HTTP command 
and do 404(item,fd) no such object 


not implemented( int fd) 
{ 
http reply(fd,NULL,561,"Not Implemented", "Lext/plain" 


"That command is not implemented"): 


do 404(char x» item, int fd) 
| 
http reply(fd, NULL,404, "Not Found", "text/plain", 
"The item you seek is not here"); 


the directory listing section 


isadir() uses stat, not exist() uses stat 


isadir(char x f) 
{ 
struct stat info; 


return ( stat(f, &info) [= 一 1 && S ISDIR(info.st mode) ); 


not exist(char x f) 


struct stat info: 


returni stat(f,&info) == -1 }; 


do ls(char x dir, int fd) 


í 
L 


DIR * dirptr; 

struct dirent x direntp; 
FILE * fp; 

int bytes = 0; 


bytes = http _reply(fd,sfp,200, "OK", "text/plain" NULE); 
bytes += fprintt(fp,"Listing of Directory * s\n", dir); 


if ( (dirptr = opendir¢dir)} t= NULL | 
whilet direntp = readdir€dirptr) )! 
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bytes += fprintf(fp, "% s\n", direntp- —d name); 


} 
closedir(dirptr) > 


| 
fclose(fp); 


server bytes sent += bytes; 


functions to cat files here. 


file typetfilename) returns the 'extension'. cat uses it 


OZ ee ae eee ee ei si eee ee ee 一- -re 一 一 一 一- 一- 一 一 


char * file type(char +» f) 
{ 
char * ep; 
if (C (cp = strrchr(f,'.' )) != NULL) 
return cept 1; 


return" -"; 


| 
/* do cat(filename,fd). sends header then the contents «/ 


do cat(char xf, int fd) 
i 


char x extension = file type(f); 
char * type = "text/plain "; 
FILE * fpsock, * fpfile; 

intc; 


intbytes = 0; 


if ( strcmp(extension, "html ") ==0 ) 
type = "text/html": 

else if ( stromp(extension, "gif") ==0) 
type = "image/gif"; 

else if ( strcmp(extension, "jpg") ==0 ) 
type - "image/jpeg"; 

else if ( stremp(extension, "jpeg") --0) 


type = "image/jpeg"; 
fpsock = fdopen(fd, "w"); 
fpfile = fopen( f , "r'). 


if ( fpsock |= NULL && fpfile !- NULL) 

| 
bytes = http reply(fd,&fpsock,200, "OK" type, NULL) ; 
while( (c = getc(fpfile} ) 1= EOF | 
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putc(c, fpsock); 
bytes tt: 
i 
felosetipfilej; 
feloseífpsock}; 


| 


server bytes sent 十 = bytes; 


| 


此 程序 虽然 能 够 正常 工作 ,但 还 是 有 一 个 问题 ;统计 的 功能 使 用 共享 变量 机 制 ,但 共享 
的 变量 并 未 被 互 斥 锁 所 保护 。 如 人 互 斥 锁 的 功能 就 留 给 大 家 作为 练习 。 


14.7 线程 和 动画 


Web 服务 器 程序 不 需要 线程 也 可 以 工作 ,因为 可 以 使 用 fork 来 处 理 并 发 的 请 求 。 然 而 
如 果 没 有 引 人 线 程 机 制 ,Web 浏览 器 却 无 法 轻易 地 使 画面 和 广告 动 起 来 。 对 线程 的 下 一个 
应 用 是 如 何 用 多 线程 来 控制 动画 。 

在 视频 游戏 那 一 章 中 ,使 用 了 定时 器 来 控制 动画 。 定 时 器 以 一 个 特定 的 时 间 闻 隔 来 发 
送 SIGALRM 消息 ,信号 处 理 者 使 用 计数 器 来 决定 何 时 移动 图 片 。 


14.7.1 使 用 线程 的 优点 


信号 处 理 者 和 定时 器 的 机 制 虽然 可 以 完成 上 作 , 但 线程 机 制 更 好 地 匹配 了 内 部 和 外 部 的 结 
构 。 在 外 部 ,用 户 可 以 看 见 商 个 独立 的 活动 流程 :动画 和 键盘 控制 ,如 图 14. 10 所 示 ， 


动 两 线程 会 用 到 关于 
动画 的 设置 

TOM Em 

i éireccricn[ 4 
Dit cd 
会 修改 动画 的 设置 





图 14. 10 AMAR RRB h 


在 内 部 ,线程 可 以 将 控制 动画 代码 和 键盘 输入 代 硝 分 开 。 如 图 14. 11 所 示 ,线程 间 通 过 
共享 变量 方式 定义 位 置 .动画 速度 ， 

当然 ,画面 的 移动 还 是 通过 隆 藏 的 定时 器 来 完成 的 ,但 多 线程 的 解决 方案 证 我 们 更 关注 
于 程序 的 组 织 结构 。 

多 线程 与 原先 的 方法 相 比 还 有 另外 个 好 处 。 现 代 的 线程 库 人 允许 不 同 的 线程 运行 在 不 
同 的 处 理 部 芯片 上 ,从 而 实现 了 真正 意义 上 的 并 行 。 对 于 动画 而 言 , 其 贺 道 .旋转 以 及 纹理 
的 纵 制 都 需要 复杂 的 计算 ,因此 在 多 个 处 理 器 上 运行 线程 可 以 提供 更 快 的 处 理 速度 和 更 加 
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HAR 动画 线程 
ff 14.11 动画 线程 及 键盘 线程 


14.7.2 多 线程 版 本 的 bounceld. c 
比较 一 下 原先 版 本 bounceld,c 与 新 的 两 线程 版 本 tbounceld, c HR Fl: 


/* h tbounceld. c, controlled animation using two threads 


* note ane thread handles animation 

^ other thread handles keyboard input 

* compile cc tbounceld.c - leurses - lpthread - o tbounceld 
x/ 


4 include « stdio. h> 

# include <curses. h> 
# include <prhread. h> 
书 include <stdlib.h> 
8 include —unistd. hœ 


/* shared variables both threads use. These need a mutex. #/ 


# define MESSAGE " hello" 


int row; /* current row x/ 
int col; /* current column  «/ 
int dir; /* where we are going */ 
int delay; /* delay between moves »/ 
main() 
int ndelay; /* new delay */ 
int €; /* user input »/ 
pthread_t msg thread: /* à thread x/ 


void s moving msg; 


initscr(); /* init curses and tty «/ 
crmode() ; 
noecho() > 


Ss pe So rm ol — n 
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clear(): 

row = 10; /* start here «/ 

col = Os 

dir = 1; /* add 1 to row number x/ 
delay = 200; /* 200ms = 0.2 seconds */ 


if ( pthread create(&msg thread, NULL,moving msg,MESSAGE) ){ 
fprintf(stderr, "error creating thread"); 
endwint): 
exit(0); 

t 


while(1) | 
ndelay = 0; 
c = getch(); 
if (c == 'Q') break; 
ifte == ' ')dir = -dir; 
if {c == 'f' && delay > 2 ) ndelay = delay/2; 
if( c == 's') ndelay = delay * 2; 
if ( ndelay > 0 } 
delay = ndelay ; 
j 
pthread cancel(msg thread}; 
endwint(}: 


| 


void x moving msg(char + msg) 


i 


while( 1 ) | 
usleep(delay « 1000); /* sleep a while x/ 
move( row, col 5; / * set cursor position x/ 
addstr( msg ) ; /* redo message x/ 
refresh(); /* and show it x/ 


/* move to next column and check for bouncing »/ 


col += dir; /* move to new column x/ 
if { cal < = O&& dir == -1) 

dir - l: 
else if { col + strlení(msq) > = COLS && dir == i } 


| 


新 版 本 的 动画 程序 与 老 版 本 的 单线 程 程序 有 何 区 别 呢 ? 最 大 的 不 同 之 处 在 于 main K 
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数 中 创建 了 一 个 新 的 线程 来 执行 moving msg PSY. moving msg 图 数 执行 了 一 个 简单 的 御 
环 ;sleep,move, 检 查 跳 跃 ,repeat。 同 时 ,在 同一 个 进程 的 另 一 部 分 ,main eB COL TAA T— 1 [8] 
Æ BÉ XP getch, 处理 ,repeat。 

修改 后 的 程序 仍然 用 全 局 变量 表示 球 的 状态 。 在 基于 中 断 的 版 本 中 ,必须 使 用 全 局 变 
量 , 因 为 无 法 将 参数 传 给 信号 处 理 者 。 然 而 线程 机 制 却 允许 线程 接收 参数 ,因此 可 以 像 上 面 
字数 统计 程序 的 第 三 .第 四 版 本 一 样 ,通过 创建 结构 体 , 并 将 其 地 址 传 给 线程 的 方式 来 改进 
EY. 


14.7.3. 基于 多 线程 机 制 的 多 重 动画 : tanimate.c 


怎样 才 可 以 同时 使 多 条 消息 活动 起 来 呢 ? 多 线程 的 字数 统计 程序 并 发 地 运行 了 多 个 字 
数 统计 函数 的 实例 ,每 一 个 调用 部 传递 给 此 函数 一 个 文件 名 和 一 个 独立 的 计数 淮 。 用 同样 
的 道理 可 以 运行 并 行 的 动画 ， 

下 面 的 多 线程 动画 程序 tanimate. c 是 tbouncel. c 的 一 个 扩展 。ranimate c 最 多 可 以 接 
受 10 个 命令 行 的 参数 ,使 每 一 个 参数 在 不 同 的 行 上 移动 ,并 且 有 自己 独立 的 速度 和 方向 。 例 
如 .下 面 的 命令 


tanimate 'Buy this' "Drive this car' 'Spend Money here’ Consume '1Buy! ' 


将 产生 一 个 包含 多 种 跳动 的 动画 消息 ,如 图 14. 12 PER. 


T qn 


Oop ae aie leere e 









Buy this! 
Drive this car! 





zy Spend money here! 
ES Consume! 
Buy! 













14.12 多 种 跳动 的 动画 消息 


用 户 可 以 遂 过 按键 "0”“1” 等 使 处 在 该 行 上 的 消息 跳动 。 

也 可 以 使 一 组 字符 绅 活 动 起 来 ,甚至 是 那些 Unix 的 工具 ,可 以 尝试 下 面 的 命令 ; 
taninate ‘la! 

taninate 'ugers' 


tanimate 'date' 


tanimate 在 不 同 的 线程 中 运行 控制 动画 的 函数 。 这 个 函数 的 每 一 个 实例 都 接收 到 原始 
线程 所 传 的 一 组 不 同 的 参数 。 参 数 指 定 了 消息 名 称 \ 行 号 ,移动 方向 以 及 速度 : 


/* tanimate.c; animate several strings using threads, curses, 
x usleep( ) 
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* 

* bigidea one thread for each animated string 

* one thread for keyboard control 

* shared variables for communication 

* compile ec tanimate.c - leurses - lpthread - o tanimate 
* to do needs locks for shared variables 

* nice to put screen handiing in its own thread 


3e fi 


it include < stdio. h> 

# include «curses. h> 
# include < pthread. h> 
# include = stdlib. h— 
+ include < unistd. h> 


# define MAXMSG 10 /* limit to number of strings x/ 


+ define TUNIT 20000 /* timeunits in microseconds «/ 


struct propset | 


char * str: /* the message x/ 

int row; /* the row */ 

int delay; /* delay in time units xj 
int dir; /* tlor -1»*s/ 


pthread mutex t mx = PTHREAD MUTEX INITIALIZER; 


int maintint ac, char * av| | 


+ 


int c. /* user input */ 

pthread t thrds| AXMSG ] ， /* the threads x/ 

struct propset props] AXMSG]- /* properties of string */ 
void * animate( ) - /* the function «/ 

int num msg ; /* number of strings */ 
int i; 

if (ac == 1}; 


printf( "usage: tanimate string .. Nn"); 


exit(1). 


num msg = setup(ac- 1 av+ l,props); 


/* create all the threads */ 
for(i-0 ; inum msg; i++) 
if ( pthread creete(&thrds|i;, NULL, animate, &props|i ))! 
fprintf(stderr, "error creating thread"); 


endwin(?). 


PHE 线程 机 制 : 并 发 咕 煞 的 使 用 


人 一 一 


exittOD: 
j 


/* process user input x/ 
while(i) | 
c = getch(); 
if (c == 'O") break; 
if (tc == ' 1) 
for (i= 0; iec num_msg;i++ } 
props|i].dir = - props[ i]. dir; 
if (cl = '0'&&o«-'9!')/ 
eres Woe 
if ( i « num msg } 


props[i].dir = - props|i!. dir; 


一 一 


/* cancel all the threads */ 

pthread mutex lock(&mx); 

for (i= 0; i-cnum msd; i++ } 
pthread cancel(&hrds| i |}; 

endwint >: 

return Ù; 


int setup(int nstrings, char x atrings( |, struct propset props! |) 


i 


int num msg = ( nstrings > MAXMSG ? MAXMSG ; nstrings ); 


int i; 


/* assign rows and velocities to each string x*/ 


srand(getpid()); 

for ti=0 , i< num msg; i44; 
props|il.str = strings| il; /* the message */ 
props| i|. row = i; /* the row «/ 
props|i].delay = 1+ (randi) €15); /* a speed x; 
props|i].dir = ((rand(? %2)? 1:- 1): fe *lor-19«/ 


| 


/* set up curses x/ 

initscr(); 

crmode() ; 

noecho(): 

clear(): 

mvprintw (LINES — 1,0,"'O' to quit, '0'.. "$d? to bounce", 


num msg ~ 1) : 


4 


7 
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return num msg; 


j 


/* the code that runs in each thread */ 
void * animate(void * arg? 


『 


à 


struct propset * info = ard; /* point to info block #/ 
int len = strlen(info- str) *?; /* +2 for padding */ 

int col = rand() $ (COLS - Jen - 3); /* space for padding xy 
while( 1 ) 


: 


usleep(info - “delay * TUNIT) ; 


pthread mutex lock(&kmx); /* only one thread */ 
nove( info- > row, col 9; /* can call curses x/ 
addch(" "5; | /* at the same time x/ 
addstr( info- “str ); /x Since I doubt it is x/ 
addch(' '); /* reentrant */ 
move( LINES -],COLS - 02; /* park cursor */ 
refreshí); /* and show it */ 

pthread mutex unlock(&mx); fs donewith curses */ 


/* move item to next column and check for bouncing x^ 


col + = info- dir; 


if ( col <2 0 && info- dir == -1} 
info- =-dir = 1; 
else if {col + len > = COLS SS info- 2=dir == 1) 


info- dir = - 1; 


14.7.4  tanimate, c 中 的 互 斥 量 


上 面 的 程序 ,整个 代码 分 为 三 段 :初始 化 .控制 移动 消息 的 函数 和 一 个 读 取 和 处 理 用 户 
输入 的 循环 。 用 户 输入 循环 在 初始 线程 中 运行 ,而 控制 动画 的 函数 却 是 运行 在 好 几 个 线程 
中 。tanimate 可 以 最 多 同时 有 11 个 线程 在 运行 。 在 线程 并 行 运行 过 程 中 ,共享 资源 是 什么 ? 
X. du fey ok Bi LE £X ER [8E B0 3E 8 np E E? 

1. 数据 冲突 : 互 斥 量 的 动态 初始 化 

控制 动画 的 函数 可 以 使 用 或 修改 作为 参数 传递 给 它 的 结构 体 成 员 的 值 , 它 们 包括 位 置 、 
速度 以 及 运动 方向 。 当 用 广 使 一 条 消息 跳动 之 后 ;输入 线程 修改 了 结构 体 中 成 员 dir 的 值 ， 
大 家 都 知道 ,共享 变量 需要 互 斥 量 来 防止 数据 的 冲突 。 那 么 是 何 需 要 为 所 有 的 方向 变量 ( 即 
结构 体 中 芍 成 员 dr 增加 一 个 瑟 斥 量 呢 ? 
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一 个 比较 好 的 方案 是 在 每 一 个 结构 体 中 建 一 个 互 斥 量 。 当 控制 动画 的 线程 和 用 户 输入 
线程 读 取 战 修改 结构 体 中 共享 变量 的 时 由 , 这 个 总 斥 量 开始 工作 。 修 改 后 的 结构 体 定义 
P: 


struct propsett 


char * str; /* the message */ 
int LOW: /* the row x/ 
int delay: /* delay in time units */ 
int dir; ix *1o0r-1»s/ 
pthread mutex t iock; /* a mutex for dirs / 
| 
setup 中 的 初始 化 程序 如 下 : 
for (i=0; i-num msg; i++ J| 
props[i].str = strings|i'; /* the message »/ 
props|[i]l.row = i; /* the row #/ 
props[i|.delay = 1+ (rand() %15); /* a speed x/ 


props|i].dir = ({rand(}%*%2)7 1,-1)- J+ #1lor -1 x/ 
pthread mutex_init(&props/ i]. lock, NULL) ; 
} 


程序 中 其 他 的 改进 留 给 大 家 和 作为 练习 ， 

2. 屏幕 冲突 :临界 区 

方向 变量 并 不 是 惟一 的 共享 资源 。 收 改 屏 蒂 和 光标 位 置 的 各 峭 数 同样 也 被 所 有 动画 线 
Fg., HHE E mx 来 防止 对 这 些 函 数 的 同步 访问 冲突 ， 

看 一 下 animate 中 的 屏幕 控制 调用 ;move、addch 、addstr 和 refresh。 如 果 两 个 线程 并 发 
地 按照 这 个 顺序 执行 指令 ,那么 结果 会 怎样 ? 举例 来 说 ,如 果 两 个 线程 交替 地 调用 ;move、 
move、addch .addch ,addstr\addstr…, 会 导致 什么 样 的 结果 ? 

第 一 个 线程 使 用 move 将 光标 置 于 某 个 屏幕 位 置 , 然 后 第 二 个 线程 多 会 将 其 牧 到 别 的 地 
方 去 。 然 而 这 时 第 一 个 线程 以 为 光标 述 在 诛 处 ,就 将 一 些 文 字 输 出 到 这 个 位 置 , 结 果 显 然 是 
错误 的 1 

由 于 设置 光标 的 库 殴 数 不 会 意识 到 线程 的 存在 ;所 以 对 某 个 特定 函数 的 访问 并 不 会 因 
为 多 线 程 的 存在 而 受 干扰 。 但 为 了 保证 某 一 时 刻 只 有 一 个 线程 可 以 访问 设置 光标 的 函数 ， 
这 里 同样 使 用 了 互 上 放量 机 制 。 

光标 控制 尔 数 库 包 含 了 许多 内 部 的 结构 体 。 就 像 用 互 斥 量 来 保护 白 定 义 数 据 结 构 一 
样 ,这 里 也 使 用 互 斥 量 来 防止 对 系统 系统 库 内 部 的 数据 结构 的 访问 冲突 。 


14.7.5 屏幕 控制 线程 


使 用 互 太 量 并 不 是 防止 屏幕 控制 冲 罕 的 惟一 方法 。 另 一 个 方法 就 是 创建 一 个 新 的 线程 
来 处 理 所 有 对 屏幕 控制 函数 的 调用 ,如 图 14. 13 所 示 ， 
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诅 个 移动 的 图 片 由 一 个 独立 的 线程 控制 这些 
——— ——— — 

x : 一 个 线程 接收 
到 对 屏幕 的 更 
gk. AE 
调用 屏幕 处 再 
函数 





rw [E 
处 理 用 户 输 入 om 


图 14. 13 独立 处 理 屏 幕 控制 的 线程 


可 以 把 这 个 屏幕 控制 线程 看 成 在 一 个 大 公司 中 的 公共 关系 部 门 。 任 何 想 要 加 媒体 发 送 
消息 的 部 门 都 必须 向 公共 关系 部 门 发 送 请 求 。 公 共 关 系 部 门 里 的 员工 只 关心 如 何 将 消息 发 
送出 去 。 

其 实 这 个 屏幕 控制 线程 在 功能 上 就 像 这 个 公关 部 一 样 ,任何 和 希望 向 屏幕 发 消息 的 线程 
都 必须 向 这 个 屏幕 管 理 线程 发 送 请 求 。 

采用 这 种 机 制 之 后 ,每 个 线程 所 发 送 的 请 求 就 应 该 包含 这 些 信息 : 行 号 . 列 号 和 消息 字 
符 串 。 控 制 动 画 的 线程 发 出 消息 ,屏幕 管理 线程 接 到 消息 后 ,将 其 显示 在 屏幕 上 ， 

这 种 生产 者 (发 消息 线程 ) 一 一 消费 者 (接收 消息 线程 ) 的 设计 类似 于 前 面 学 习 的 多 线程 
版 的 字数 统计 各 序 : 帘 要 一 个 仓储 变量 来 放置 消息 ,通过 互 斥 量 来 避免 对 此 存储 变量 的 访问 
冲 讼 ,以 及 一 个 条 件 变 量 ,在 动画 线 穆 发 送 消息 之 后 ,可 以 通过 这 个 条 件 变 量 将 屏幕 声 制 线 
程 唤醒 ， 

对 于 屏幕 控制 功能 的 集中 化 和 抽象 化 设计 使 得 程序 更 加 灵活 。 就 算 屏 疾 显 示 系 统 更 换 
了 ,也 只 罕 改变 屏幕 控制 线程 中 使 用 的 函数 。 屏 幕 控制 线程 甚至 还 可 以 发 起 同 远 端 显 示 服 
务 器 的 一 个 会 话 ,通过 管道 或 春 接 字 将 消息 发 过 去 ,然而 这 一 切 对 于 控制 动画 的 线程 来 说 都 
是 透明 的 。 改 进 这 个 程序 就 留 给 大 家 作为 练习 完成 。 


小 f 


l. ŽAS 

执行 线路 即 为 程序 的 控制 流程 。pthreads 的 线程 库 人 允许 程序 在 同一 时 刻 运 行 多 个 

pA S 

。 同时 执行 的 各 函数 都 拥有 自己 的 局 部 变量 ,但 共 剖 所 有 的 全 局 变量 和 动态 分 配 的 数 
1525 [8] . 

。 当 线程 共享 变量 时 UARIECNARERER BOR, REMAR A RE 

一 时 刻 只 有 一 个 线程 在 对 共享 变量 访问 。 

线程 问 通过 条 件 变 荣 来 互相 通知 和 同步 数据 。 一 个 线程 排 起 并 等 待 着 条 件 变量 按照 

某 种 特定 方式 变化 ,而 另 一 个 线程 则 发 信号 使 得 条 件 变 基 发 生变 化 。 

。 线程 需要 使 用 互 斥 量 来 避免 对 于 共 储 资源 操作 画 数 的 访问 冲突 。 非 重 人 的 函数 必须 


* 


+ 
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按照 这 种 方式 进行 保护 。 
2. FoPRHA | 
一 个 程序 可 以 包 插 若干 进程 ,进程 之 间 通 过 管道 ,文件 ,socket 和 信号 进行 通信 。 程 序 也 
可 以 包含 多 个 线程 ,它们 之 间 通 过 共享 变量 文件. 锁 以 及 信号 进行 通信 。 前 一 章 主 要 学 习 
了 进程 间 的 通信 。 那 么 Unix PRET SPAR? 如 何 为 你 的 应 用 程序 选择 最 合 
适 的 通信 方法 呢 ? 下 .一 章 将 给 出 这 些 问题 的 管 案 ， 
4, 习题 


14.1 


14. 3 


线程 基本 操作 的 练习 。 对 hello multi. c Ain PER: 

首先 ,多 加 几 条 消息 色 程 序 中 ,接着 为 新 加 的 消息 创建 线程 。 

然后 修改 print, msg 函数 中 的 循环 次 数 ,使 其 与 所 要 打印 的 字符 串 的 长 度 一 致 。 
在 每 一 条 pthread join 语句 之 后 打印 信息 ,以 观察 程序 的 执行 情况 ,并 解释 结果 。 


对 tanimate 和 使 用 管道 命令 ,tanimate 就 可 以 从 标准 输入 中 读 取 它 的 字符 串 列 表 。 


”那么 如 下 的 命令 : 


who | tanimate 


就 可 以 起 作用 了 。 将 这 一 功能 添加 进去 并 不 是 一 件 小 事 。 需 要 首先 从 标准 输入 
REITIT ,然后 将 标准 输入 重 定 问 到 终端 ,这 样 屏 幕 控 制 线程 就 可 以 非 标 准 的 
模式 读 取 字符 了 (打开 /devitty 并 将 它 复制 到 标准 输入 )。 


在 视频 游戏 懂 一 章 中 ,大 家 一 定 注意 到 在 代码 的 临界 区 使 用 信和 号 标记 来 防止 访 
问 冲 罕 。 将 信号 标记 和 信和 叶 处 理 机 制 与 线程 . 互 斥 锁 以 及 条 件 变量 机 制 做 一 个 
比较 。 


4. CEDAR C] 


14.4 


14. 5 


14.6 


14. 7 


f£ hello multi. c 中 ,原始 线程 剑 建 了 两 个 打印 线程 。 写 一 个 新 的 程序 ,在 打印 
“hello” 的 线程 中 创建 一 个 新 的 线程 来 打印 “woridxn?>。 本 一 个 线程 等 待 打印 
“worldin” 的 线程 返回 ? WHA? 


twordcountl. c 用 了 三 个 线程 :初始 线程 和 两 个 计数 线程 ,但 初始 线程 完成 很 少 
的 功能 。 写 一 个 新 程序 ,让 原 线程 统计 第 一 个 文件 的 宇 数 ,然后 再 创建 一 个 线程 
统计 第 二 个 文件 的 字数 。 这 种 方法 是 否 执 行 得 快 一 点 ?了 哪 一 种 设计 更 好 ? 


count words 因数 报错 说 无 法 打开 指定 的 文件 。 尽 管 这 样 另 一 个 线程 仍然 继续 
运行 。 这 样 好 吗 ? BANIE count words BERT TE T] JF X ERR exit 
退出 运行 。 


如 何 扩展 twordcount2. c 和 twordcount3.c 中 的 方法 ,让 程序 可 以 在 命令 行 上 接 
收 多 个 文件 ? 修改 这 两 个 程序 使 它们 可 以 在 命令 行 上 接收 任意 数目 的 文件 名 。 
哪 一 个 版 本 的 程序 容易 扩展 ? 哪 一 个 更 高 效 呢 ? 


* 462 * 


Unix/Linux 编程 实战 教程 


14.8 进程 与 线程 : 


14. 


14. 


14, 


14. 


14. 


CD 写 一 个 新 版 本 的 字数 统计 程序 ,用 fork 为 每 个 文件 创建 新 的 进程 。 需 要 为 
子 进 程 没 计 一 个 系统 ,使 它们 可 以 将 结果 传 回 给 父 进 程 使 用 。 不 要 使 用 进程 
退出 值 来 返回 这 个 结果 ,因为 这 个 值 不 能 超出 255。 使 用 fork 的 一 个 好 处 就 
是 可 以 使 用 标准 的 we 一 w 命令 来 统计 每 个 文件 中 的 字符 数 。 

(2) 写 一 个 单线 程 的 字数 统计 程序 。 

(3) 将 这 三 个 版 本 的 程序 (进程 .多 线程 和 单线 程 ) 敌 一 下 比较 , 哪 一 个 容易 设计 、 
容易 编码 ?” 哪 :一 个 执行 效率 高 ? 哪 一 个 可 移植 性 好 ” 


.9 扩展 twordcount4.c 程序 ,使 其 在 命令 行 上 可 以 接收 多 于 两 个 文件 名 。 


;0 


14 


15 


将 twordcount4. c 中 的 全 局 变量 作为 main 函数 的 局 部 变量 ,然后 将 指向 它们 的 
指针 作为 结构 体 的 成 员 。 再 将 结构 体 地 址 传 给 线程 ， 


XE twebserv. c 中 加 入 互 斥 锁 来 保护 对 统计 变量 的 访问 。 


删除 thounceld. c 中 的 所 有 全 局 变量 。 定 义 -- 个 结构 恒 来 包含 所 有 跳动 文字 的 
ak. | 

thounceld. c 程序 中 的 共享 状态 需要 五 斥 锁 机 制 。 如 果 不 加 锁 , 会 导致 什么 样 
的 结果 ? 两 个 线程 冲 罕 会 造成 什么 样 的 结果 9? 


单字 符 串 的 动画 程序 包含 了 对 速度 的 控制 。 用 户 可 以 通信 按键 “<s "和 E 
和 和 降低 动作 间 的 延 时 ,将 速度 控制 加 入 多 学 香 串 动因 程序 中 . 


tanimate, c 中 甩 有 的 请 息 都 是 水 平 称 动 的 。 修改 程序 使 得 一 些 字 符 串 F F 
动 ,而 另 一 些 水 平移 动 。 如 何 来 控制 冲突 ” 


修改 tanimate 程序 ,使 用 一 个 单独 的 线程 进行 屏幕 管理 。 控 制 动 画 的 线程 必须 
先 将 消息 发 送 给 屏幕 管理 线程 ,由 屏幕 管理 线程 对 消息 进行 显示 。 


MT finger 服务 器 需要 一 个 多 线程 的 服务 器 来 提供 服务 。 服 务 器 每 次 接收 一 行 
输 人 人。 然后 服务 器 在 数据 库 中 查询 这 个 字符 绅 , 再 将 匹配 这 个 字符 串 的 记录 返 
Hae Pa. ARS TT a aR: 

(12 将 用 户 数据 库 载 人 内 存 ; 

(2) 为 每 一 个 请 求 创 建 一 个 独立 线程 (detached thread) ; 

(3) 服务 器 记录 每 秒 钟 所 匹配 的 记 采 的 数目 ; 

(4) 对 于 STATUS 的 特殊 请 求 ,服务 器 将 返回 统计 数据 ; 

(5) 在 接收 到 SIGHUP 消息 之 后 ,服务 毅 删 新 其 内 部 数据 库 。 


TE tanimate 那 一 节 的 结尾 , 曾 讨 论 了 如 何 将 显示 功能 与 计时 和 数据 处 理 逻 辑 分 
开 。 写 一 个 客户 /服务 器 版 本 的 tanimate 程序 ,用 数据 报 的 socket 将 简单 的 请 
求 信息 从 tanimate 程序 发 送 到 显示 服务 器 上 。 
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oo all 


CLEAR clears the display 

DRAW R C Any string puts "Any string" at row R,coiumn C 

f EL ia BO CAR P a EDHSPRB] BE Ru eR. EA (81 Sj OR RD AR ot RRA URL. 
os BAS RRR AUR IU TB SP fo BO SE ERR os BEL TE coc Eg 
日 的 时 候 , 可 以 去 研究 Unix 使 用 的 X11 window 系统 的 没 计 思想 。 
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概念 与 技巧 

. 挂 起 并 等 候 从 多 个 源 端 的 输 人 入: select 和 poll 
© 命名 管道 

e ERAN 

。 SCPE ail 

。 信和 号 量 

*。 IPC(InterProcess Communication) h Wi 
相关 的 系统 调用 与 函数 

* select, poll 

+ mkfifo 

* shmget,shmat.shmeti.shmdt 

e semget.semctl,semop 
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* talk 
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15.1 编程 方式 的 选择 


很 六 以 前 , 当 两 人 试图 互相 交流 的 时 候 , 可 选择 的 方式 非常 的 少 ; 交谈 或 者 投掷 石 块 。 
当代 人 们 的 选择 多 了 很 多 : 蜂窝 电话 .电子 邮件 .信件 、 特 快 专递 、 目 行车 投递 .网 络 电 话 、 纸 
K bonds D 贴 的 备忘录 等 ,当然 也 可 以 直接 交谈 或 投 据 石 块 。 每 种 方法 都 有 其 优点 和 伍 
A. 那么 人 们 如 何 选择 其 交流 方式 昵 ? 

作为 一 名 Unix 程序 员 ,必须 学 会 如 箱 选 择 进 程 间 通信 的 方法 。 每 一 种 方式 都 有 其 优 缺 
太 ; 如 何 进 行 选择 呢 ? 

本 章 从 学 习 talk 开始 。 人 们 使 用 talk 来 互相 发 送 消 息 , 并 将 会 比较 讨论 各 种 Unix 方 
法 ,看 看 它们 是 如 何在 进程 癌 传 递 消 息 的 。 
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15.2 talk 命令 : 从 多 个 数据 源 读 取 数 据 


Unix 的 talk 命令 是 一 种 通信 工具 。talk 允许 人 们 在 终端 间 传 送信 息 。talk 甚至 可 以 跨 
f Internet 来 连接 不 同 机 器 的 终 病 .如 图 15.1 Brom. 





对 话 进程 hosti es 一 对 话 进程 


图 }5.1 talk 连接 了 岗 络 土 的 两 个 终端 


使 用 talk 命令 的 时 候 . 屏 幕 被 分 为 上 下 两 个 部 分 ,用 户 以 字符 终端 模式 来 操作 。 输 入 字 
符 的 时 候 , 字 符 会 同时 显示 在 两 个 窗口 中 。 体 所 和 输入 的 字符 会 出 现在 上 面 的 窗 瑟 中 ,而 对 方 
输入 的 学 出 现在 下 面 的 窗口 中 。calk 使 用 socket 进行 通信 ,如 图 15. 2 所 示 。 





815.2 talk 命令 的 工作 方式 


talk 谷 令 读 取 字符 并 将 它们 写 到 只 的 地 ， 人 得 与 所 学 过 的 其 他 程序 不 同 ,talk 同时 等 待 从 
两 个 文件 描述 符 的 输入 ， 


15.2.1 同时 从 两 个 文件 找 述 符 读 取 数 据 


ralk 从 键盘 和 socket 接收 数据 。 从 键盘 输 人 读 取 的 字符 被 复制 到 屏幕 中 上 半 个 窗口 ， 
并 通过 socket REEMA. 同样 从 socke 读 入 的 字符 被 添加 到 屏幕 下 面 的 窗口 中 ， 

talk 的 用 户 可 以 以 任意 速度 和 任意 顺序 给 人 字符 。talk 程序 就 必须 在 任何 时 刻 都 准备 
好 从 任 一 数据 源 接收 字符 ,和 而 不 像 其 他 的 程序 可 以 依靠 明 确 的 肉 议 。 服 务 器 等 待 着 read 或 
recvfrom 的 请 求 ,并 用 write 或 sendro 发 回 一 个 应 答 。 用 户 不 可 能 一 直 在 切换 自己 的 角色 
(输入 完 之 后 等 待 别人 的 应 答 , 然 后 再 输入 ……) ,那么 talk 程序 如 何 解决 这 个 问题 呢 ? talk 


while(l)( 
read(fd Xbd,5c,1); /* read from keyboard «/ 
waddch( topwin,c); /* add to screen «/ 
write(fd_sock,&c,1); /« send to other person x/ 
read(fd sock,&c,!); /* read from other person »/ 


waddch(botuwin,c); /* add to screen ¥/ 


a A 2 — — amr © = a en ee eee: 
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按照 上 述 代 码 的 人 逻辑 ;如果 对 方 一 直 在 输入 信息 ;而 你 却 一 直 在 看 他 发 的 消息 ; 目 己 没 
HRAT MAREEA? 程序 在 第 一 个 read 调用 的 时 候 就 挂 起 了 ,并 不 会 从 你 的 对 方 
PERRA. LAMAR AHA SERA OE TT LIER LYE. 

这 里 通过 调用 feni 函 教 将 文件 描述 符 设 置 为 ONONBLGOCK 标志 信 而 使 文件 描述 符 
变 成 非 阻 塞 模式 。 使 用 非 阻塞 模式 使 得 对 于 read 的 调用 立即 返回 。 这 个 时 候 , 如 果 并 激 有 
宁 符 可 以 读 取 ,read 调用 返 同 零 。 虽 然 非 阻 硅 的 方式 可 以 工作 , 仙 是 它 占 用 了 太 多 的 处 理 器 
上 时间， 由 于 符 次 调用 read 都 是 一 个 系统 调用 ,程序 就 必须 回 到 内 核 模 式 工 作 。 ES A 
一 个 字符 到 来 之 前 系统 可 能 会 切换 上 于 次 。 


15.2.2 select 系统 调用 


Unix 系统 提供 了 系统 调用 select, 它 允许 程序 挂 起 ,并 等 待 从 不 止 一 个 文件 描述 符 的 输 
它 的 原理 很 简单 : 

(D 获得 所 需要 的 文件 描述 符 列 表 ; 

(2) 将 此 列表 传 给 select; 

(3) select 挂 起 直到 任何 一 个 文件 描述 特有 数据 到 达 ; 

(4) select 设置 一 个 变量 中 的 若干 位 ,用 来 通知 你 哪 一 个 文件 描述 符 已 经 有 输入 的 数据 。 
TEREF selectdemo c 等 待 两 个 设备 土 数据 到 达 : 


a 


/* selectdeme.c , watch for input or Lwo devices AND timeout 


x usage: selectdemo devl dev2 timeout 

x action; reports on input from each file, and 
x reports timeouts 

x / 


# include  «stdio, h> 

t include  «sys/time.h 
# include  «sys/types.h— 
# include  —umnistd.h > 

H include «l fentl. h> 


+ define oops(m,x) ( perror(m); exit(x); | 


main(int ac, char * av[ D 


i 


int fdl, fd2; /* the fds to watch x/ 
Struct timeval timeout; /* how long to wait +, 

fd set readfds- /* watch these for input x/ 
int maxtd - /* max fd plus 1 «/ 

int retval, /* return from select */ 


if (ac l= 4 3} 


fprintf(stderr, "usage; $s file file timeout", * av); 


Por — — „a —— —Ó—— — - n m a, 
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exit(1); 


/** open files «x «/ 


if ( (fdl = open(avil],Q_RDONLY)) == -1) 
oops(av[ 1], 2); 
if C (fd2 = opén(av[2],0 RDONLY)) == -1) 


oops(av[ 2], 3); 
maxfd = 1 + (fdicfd2? fdl,.fd?2); 


while(l) | 
/** make a list of file descriptors to watch * «/ 
FD ZEROC&readfds); /* clear all bits «/ 
FD SET(fdl, &readfds) ; /* set bit for fdi »/ 
FD SET(fd2, &readfds) ; /* sek bit for fd2 «/ 


/* * set timeout value x x/ 
timeout.tv sec = atoi(av|3b; /* set seconds «/ 


timeout. tv usec = 0; /* no useconds x/ 


1 


/* * wait for input « */ 
retval = select(maxfd, &readfds, NULL, NULL, &timeout) ; 
if ( retval == - 1) 
oops( "select",4); 
if ( retval > 0 }{ 
/* * check bits for each fd x x/ 
if ( FD ISSET(fdl, &readfds) ) 
showdata(av[ 1], fdl); 
if ( FD_ISSET(fd2, Sreadfds) ) 
showdata(av|2], fd2); 
i 
else 


printf("no input after &€ d seconds\n". atoi(av[3])); 


F 


} 
showdata(char + fname, int fd) 
{ 

char buf[ BUFSIZ |; 


int. n; 


printf(" $s, ", fname, n); 
fflush(stdout); 
n > read(fd, buf, BUFSIZ); 
if (nún == 一 1) 
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oops( fname, 5): 
write(1, buf, n»; 
write(1, "in", 1); 

j 


Em mE E TR, IRA AR XXE, set 
类 型 的 变量 中 。 宏 FD ZERO,.FD SET 和 FD ISSET 先 将 fd set 中 所 有 位 清除 ,然后 为 某 
文件 描述 符 设 置 一 位 ,再 对 该 位 进行 监听 。 和 希望 同时 对 两 个 文件 描述 符 监 听 ,因此 调用 了 两 
iX FD SET. 

select 调用 同时 也 接受 对 于 超时 的 处 理 。 如 果 看 指定 的 时 间 内 ,没有 数据 到 达 ,select 将 
直接 人 返回。 在 selectdemo. c 中 ,在 命令 行 接 收 一 个 字符 串 作 为 超时 的 时 间 值 。 用 下 商 的 代 
三 对 程序 进行 测试 ， 


5 cc selectdemo.c - o selactdeno 

5 ./selectdemo /dev/tty /dev/mouse 10 
hello 

/dev/tty; hello 


no input after 4 seconds 
no input after 4 seconds 
LesLing 

/dev/tty, testing 

我 移动 了 鼠标 
/dev/mouse. í 
/dev/mouse, 


/dev/mouse, y 


这 个 例子 展示 了 程序 如 何等 待 键盘 或 鼠标 输入 的 到 来 。 当 然 大 家 可 以 设计 更 加 有 意思 
的 程序 ,不 只 是 将 输入 打印 出 来 ,并 且 对 输入 进行 特定 的 处 理 。 





select 调用 小 第 如 下 ，。 
. select 
目标 同步 的 1/0 复 用 
toe tf f include <Isys/time, hz» 
ay Sy i E] int = select (int numfds, 


íd set * read set. 
fd sei * write set. 
fd sei * error set, 
struct Umeval + timeout? ; 
void FD ZERO(Íd set. » fdset? 
void FD SETtCint fd, fd, set. * fdsct? 
void FD CLRint fd. fd set. « fdset) 
void FD ISSE Tl (int fd, fd set » fdset) 
——— ——— — — Ge NNNM 
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select 


参数 numfds fig RUIT BS RAC T (ELA 1 
read set 等 待 从 此 集 台 包括 的 文件 描述 符 到 来 的 数据 
write sct 等 待 向 这 些 文件 描述 符 写 数据 的 许可 
error set 等 待 这 些 文 件 描述 符 操 作 的 异常 











timeout 超过 此 时 间 后 函数 返回 
返回 值 =i 发 生 错 误 
Q 超时 
num 满足 需求 的 文件 描述 特 的 数 日 


select 同时 监视 多 个 文件 描述 符 。 在 指定 情况 发 生 的 时 候 , 函 数 返 间 。 许 细 一 点 襄 ， 
select 监听 在 三 组 文件 描述 符 上 发 生 的 事件 ; 检查 第 一 组 是 否 可 以 读 取 ,检查 第 二 组 是 否 可 
以 写 人 ,检查 第 三 组 是 否 有 异常 发 生 。 每 一 组 的 文件 描述 符 被 记录 到 一 个 二 进 制 位 的 数组 
中 。 这 里 的 numfds 恰好 等 于 需要 监听 的 最 大 的 文件 摘 述 得 加 1. 

当 参 数 指 定 的 条 件 被 满足 或 超时 的 时 候 ,select 画 数 返回 。 若 指定 的 条 件 被 满足 ,select 
返回 满足 条 件 的 文件 描述 符 的 数目 。 

奉 任 一 参数 为 null,select 将 忽略 此 参数 。 


15.2.3 select 与 talk 


本 章 并 不 打算 把 talk 的 程序 写 出 米 ,因为 关于 定位 其他 的 用 户 和 建立 连接 还 有 很 多 步 
又 要 做 ,比如 说 : 定位 对 方 用 户 就 需要 搜寻 utmp 文件 。 大 家 已 经 学 习 过 实现 其 他 所 有 步 又 
所 知 的 知识 和 技巧 了 。 其 他 还 有 哪些 步骤 呢 ? 它们 需要 哪些 条 统 调用 ? 这 两 个 问题 就 留 给 
大 家 回答 了 。 


15.2.4 select 5 poll 


也 可 以 使 用 poll 调用 来 代替 select AIBE, select 是 由 Berkeley 研制 出 来 的 ,而 poll W 
是 见 尔 实验 室 的 成 果 。 这 两 背 完 成 类 似 的 功能 ,而 现代 的 大 部 分 的 Unix 版 本 对 于 两 者 部 
支持 。 


15.3 通信 的 选择 


talk 命令 是 Unix 系统 程序 的 一 个 很 好 的 例子 , 它 很 好 地 体现 了 进程 何如 何 进 行 通信 和 和 
分 工 合 作 。talk 中 的 两 个 进程 读 写 消息 ,就 好 像 消 息 是 被 存储 硅 常 规 的 磁盘 上 一 样 . 

talk 中 的 文件 描述 符 分 别 对 应 了 键盘 .屏幕 和 socket( 如 图 15.3 所 示 ) ,但 它们 仍然 可 以 
被 连接 到 其 他 进程 或 其 他 设备 上 去 。talk 程序 中 的 进程 间 数 据 传输 与 进程 间 的 操作 都 是 极 
为 时 要 的 部 分 。 要 知道 选择 一 个 好 的 通信 方式 和 选择 正确 的 算法 或 数据 结构 一 样 的 重 暑 。 
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写 人 文件 描述 符 





L 


ed 


| XPRESS 
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图 15, 3 三 个 文件 描述 符 


15.3.1 一 个 问题 的 三 种 解决 方案 

问题 : 从 服务 器 得 到 数据 ,将 其 传 给 客户 端 ,如 何 来 决定 选择 哪 一 种 遂 信 方法 呢 ? 想 一 
想 前 面 使 用 流 socket 写 过 的 时 间 / 日 期 服务 器 。 某 一 进程 知道 当前 的 时 间 , 而 另 一 进程 想 获 
取 时 间 信 息 ( 如 图 15. 4 所 示 ) ,如何 让 一 个 进程 从 另 一 个 进程 得 到 数据 呢 ? 


SP ha 服务 器 





图 15.4 某 进 程 拥 有 另 一 进程 所 要 获得 的 信息 


三 种 解决 方案 ; 文件 .管道 ,共享 内 存 。 图 15.5 展示 了 三 种 不 同 的 方法 : 一 种 是 已 经 学 习 
过 的 ,但 另外 的 两 种 方法 却 是 新 的 。 大 家 所 熟悉 的 方案 是 使 用 文件 ,而 男 外 的 两 种 新 方案 是 命 
名 管道 (named pipe) 及 共享 内 存 段 (share memory segment) 策 略 。 这 些 方法 分 别 通过 磁盘 .内核 
以 及 用 户 空间 进行 数据 的 传输 。 那 么 每 种 方法 具体 如 何 应 用 ? 各 有 和 何 优 缺 点 呢 ? 





两 个 进程 拥有 指 
向 同一 个 共享 内 
仓 段 的 指针 






— i LIE! 






O —— M. 通过 读 写 同 一 个 
从 营 道 传递 数据 . O cexdtxtuE 


图 15.5 三 种 传输 数据 的 方法 


15.3.2 通过 文件 的 进程 间 通 信 


进程 间 可 以 通过 文件 来 进行 通信 。 某 进程 将 数据 写 入 文件 , 别 的 进程 再 将 数据 从 文件 
中 读 出 。 

(OD 使 用 文件 进行 通信 的 时 间 / 日 期 服务 器 

这 里 不 必 写 一 个 完整 的 C 程序 ,下 面 的 一 个 shell 脚本 就 可 以 完成 任务 了 。 


B) /bin/ah 


H time server — File version 
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while true ; do 
date =» /temp/current date 
sleep } 


done 


此 服务 器 每 隔 1 EDpDUS 24 B dO GE (SL EL ES AMP. Se b IE LEE DIU FKA 
FARM eS . 

(2) JE FASC E £130 (5 09 f (8] / AP is 

E J Y CC UE ALS x 


í /bin/sh 
B timeclient - File version 


cat /tmp/current date 


(3) 使 用 文件 的 IPC 小 结 

访问 控制 : 客户 端 必须 能 够 读 取 文件 。 遂 过 使 用 标准 文件 访问 权限 ,可 以 给 予 服务 颖 号 
AER IF ARR HA Pte RA BERR. 

Be Pin: TER EDEP UARA xi PER. Unix 并 不 限制 同时 打 并 间 一 
文件 的 进程 数目 。 

TSA: 服务 况 遂 过 清空 内 容 再 重 写 的 方法 米 更 新 文件 。 如 果菜 客户 恰好 在 油 室 和 
重 写 之 司 谱 取 文 件 ,那么 它 得 到 的 将 是 一 个 空 的 或 只 有 部 分 的 内 容 。 

BE ee SAE: 服务 器 和 客户 端 可 以 使 用 某 种 类 型 的 互 斥 量 来 避免 竟 态 条 件 。 后 面 的 
章节 中 大 家 将 会 学 钊 文件 锁 的 方法 。 另 外 ,如 果 服 务 器 在 程序 中 使 用 lseek 和 write KAX 
替换 create, 这样 文 件 永远 都 不 可 能 为 空 , 因 为 write 是 一 个 原子 操作 , 它 不 会 在 执行 中 被 
TT UF 


15.3.3 命名 管道 


通 节 的 管道 只 能 连接 相关 的 进程 。 常 规 管道 由 进程 创建 .并 由 最 后 一 个 进程 关闭 。 

使 用 个 名 管道 可 以 血 接 不 相关 的 进入 ,并 且 可 以 独立 于 进程 存在 (如 留 15.6 Br). 称 
这 样 的 命名 管道 为 FIFO( 先 进 先 出 队列 )。FIFO 类 似 于 放 在 和 草坪 上 的 一 段 给 花园 灌水 的 水 
管 。 任 何人 都 可 以 将 此 水 管 的 一 羡 放 在 自己 的 耳 杀 边 , 而 另 一 个 人 通过 水 管 向 对 方 说 话 ， 
人 们 可 以 通过 此 水 管 进 行 交 流 , 而 在 没有 人 使 用 的 时 和 候 ,水 管 仍 然 是 存在 的 。FIFO 可 以 看 
fF B oci dm M BK. 





& 15.6 FIFO 与 进程 独立 
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1. 使 用 FIFQ) 

(1) 如 何 创 建 FIFO? 

HE Be mkfifoCchar * name, mode t mode) 使 用 指定 的 权限 模式 来 创建 FIFO,  mkfifo 
命令 通常 调用 这 个 图 数 ， 

(2) fn fey Mi ER FIFO? 

354p FHE XC FF unlink < fifoname) pg Z& 9T LAA SR BR FIFO, 

(3) 如 何 监 听 FIFO 的 连接 ? 

使 用 open(filoname,O RDONL YO IR, open 末 数 阻塞 进程 直到 其 一 进程 打开 FIFO 
进行 写 操作 ， 

(4) 如 何 通 过 FIFO 开始 会 话 ? 

使 用 open(fifoname,O. WRONL YO BX, UE iif open RA SHE A BE BERTH 
FIFO 进行 读 取 操作 。 

(5) 了 商 进 程 如 何 通过 FIFO 进行 通信 ? 

发 送 进程 用 write 调用 ,人 测 监 听 进 程 使 用 read 调用 。 写 进程 调用 close 来 通知 读 进 程 通 
AZAR 

Fi Bi shell 脚本 是 基于 FIFO 的 时 间 / 日 期 服务 的 服务 器 和 客户 端 程序 : 


i! /bin/sh 
i time server 
while true ; do 
rm — f /tmp/time fifo 
mkfifo /tmp/time fifo 
date >> /tap/time fifo 
done 
#1 /bin/sh 
# time client 


cat /tmp/time fifo 


2, FIFO 类 型 的 IPC 小 结 

访问 : FIFO 使 用 与 通常 文件 相同 的 文件 访问 。 有 最 务 器 有 写 权 限 , 而 客户 端 只 限于 该 
权限 ， 

PS. 命名 管道 是 一 个 队列 而 不 是 常规 文件 。 写 者 将 字 节 写 入 队列 ,而 读者 从 队 
列 头 部 移出 字 节 。 每 个 客户 端 都 会 将 时 间 7 吕 期 的 数据 移出 队列 ,因此 服务 器 必须 重 写 数据 ， 

mR: FIFO 版 本 的 时 间 / 日 期 服务 器 程序 完全 不 存在 竞 态 条 件 问 题 。 在 信息 的 长 
度 不 超过 管道 的 容量 的 情况 下 ,read 和 write 系统 调用 只 是 原子 操作 。 读 取 探 作 将 管道 清空 
而 写 人 操作 又 将 管道 塞 满 。 在 读者 和 写 者 连通 之 前 ,系统 内 核 将 进程 挂 起 。 因 此 锁 机 制 在 
ix BJ WE. 

AE, ARS eS A FIFO HACHR AAS Poet FIFO 来 读 取 数据 。 
在 某 些 应 用 程序 中 ,服务 器 从 FIFO 中 读 取 数据 ,然后 等 待 客户 端 把 数据 写 人 。 大 家 想 想 看 
有 没有 服务 器 等 每 客户 端 输入 的 例子 ? 
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15.3.4 共享 内 存 

字 节 流 是 如 何 通 过 文件 或 FIFO 来 传输 的 ? write 将 数据 从 内 存 复 制 到 内 核 绥 存 中 ， 
read 将 数据 从 内 核 缓存 复 制 到 内 存 中 。 

如 果 进 程 运 行 在 用 户 空间 的 不 回 部 分 ,进程 间 是 如 和 何 将 数据 从 内 核 缀 存 中 复制 进 复 市 
出 的 呢 ? 同一 个 系统 里 的 两 个 进程 通过 使 用 共 孕 的 内 存 段 来 交换 数据 。 共 孚 的 内 往 段 是 用 
户 内 存 的 一 部 分 。 每 一 个 进程 都 有 一 个 指向 此 内 存 段 的 指针 (如 图 15.7 Sor). f SE DTA 
限 的 设置 ,所 有 进程 部 可 以 读 取 这 一 鼎 空 间 中 的 数据 。 因 此 进程 间 的 资源 是 共 储 的 ,而 不 是 
被 复制 来 复制 去 的 。 共 享 内 存 段 对 于 进程 而 言 , 就 类 似 于 共享 变量 对 于 线程 一 样 。 


车 到 内 a 以 
区 许 一 个 进程 
i 接 将 数据 放 
AÀ--UP SER 
BA] He =e lal 





s FEE SE SE 


次 复制 数据 
图 15.7. ARRERA- ANFEN 


). 共享 内 存 段 的 一 些 葡 本 概念 
。 共 旦 内 存 自 在 内 存 中 不 依 辐 于 进程 的 存在 而 存在 。 
FAA RA A CASH. AKERS (key). 

”关键 字 是 一 个 整 型 数 。 

” 共 到 内存 段 有 目 己 的 拥有 者 以 及 权限 位 。 

”进程 可 以 连接 到 某 共 享 内 存 段 ,并 且 获 得 指向 此 段 的 指针 。 

2. RRA AER 

(1) AN fil £3 Bi SES P8 FF ER 7 

int seg Jd = shmget(key. size-of—- segment. flags) 

如 条 内 存 段 存 在 ,函数 shmgel 找到 它 的 位 置 。 如 果 不 存在 ,可 以 通过 在 flags 值 中 指定 
一 个 创建 此 段 和 初始 化 权 根 模式 的 请 求 。 

(2) 如 何 将 进程 连接 到 某 个 共享 内 存 段 ? 

void ptr = * shmat(seg id NULL, flags) 

shmal 在 进香 的 地 址 空间 中 创建 共享 内 存 段 的 部 分 ,并 返回 一 个 指向 此 段 的 指针 。flags 
FAK Te I PTIAEREAEH RE, 

(3) Bie] 533E A f Bx dE f VES SE 9r? 

strepy(ptr. "hello; 

memcepy() pirli] RE fl — eN FB OTE A AE. 

3. 使 用 上 共 训 内存 段 的 时 间 / 日 期 服务 器 


> shn ts.c ; the time server using shared memory. a bizarre application x/ 
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a tt 


t include — —stdio.h-— 
# include  «sys/shm.h- 


# include  —timc.h-- 


4 define TEME MEM KEY 89 /* like a filename xj 
# define SEG SIZE ((size t)100) /* size of segment xf 


# define oops(m,x) | perror(m); exit(x); } 


maint) 

| 
int seq id; 
char * mem ptr, * ctime(); 
long now? 


int ns 


/* create a shared memory segment */ 
seg id = shmget( TIME MEM KEY, SEG SIZE, IPC CREAT|O777 ); 


if ( seg id -- 13} 
oops("shmget", 1}; 


/* attach to it and get a pointer to where it attaches */ 


mem ptr = shmat( seg id, NULL, 0); 
if ( mem ptr == ( void »} — 1 J 
oops("shmat", 2); 


/* run for a minute x/ 


for (n=0; n«z60; ntt yi 


time( &now ): /* get the time x/ 
strcpy(mem ptr, ctimet&now)); /* write to mem =/ 
sleep(1); /* wait a sec */ 


j 


/* now remove it */ 


shmctl( seg id, IPC RMID, NULL ) : 


4. 使 用 共享 内 存 自 的 时 间 / HORE P 3S 


/* shm tc.c : the time client using shared memory, a bizarre application */ 


jitinolude  «istdio.h 
# include <‘sys/shm. h> 
H include «tine. h> 


# define TIME_MEM_ KEY 99 /* kind of like a port number «/ 
ttdefine SEG SIZE ((size t)100) /* size of segment */ 
H define oops(m,x) { perror(m); exit(x); } 
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maint ) 
| 
int geg id; 
char — * mem ptr, * ctime(); 
long now: 
/* create a shared memory segment */ 
seg id = shmget( TIME MEM KEY, SEG SIZE, 0777 ); 
if ( seg id == E 
ocops("shmget",1); 
/* attach to it and get a pointer to where it attaches «/ 
mem ptr = shmat( seg id, NULL, Ô 5; 
if ( mem ptr == ( void +) -1) 
oops("shmat",2); 


printf("The time, direct from memory, .. $s", mem_ptr); 


shmdt{ mem ptr ); /* detach, but not needed here «/ 


| 


5. 共享 内 存 段 类 型 的 IJPC 小 结 

访问 : 客户 端 必 须 有 对 共享 内 存 段 的 读 权 限 。 共 享 内 存 段 拥有 一 个 权限 系统 , 它 的 工作 
原理 和 文件 权限 系统 类 似 。 共 倍 内 存 姊 有 上 崩 蕊 的 拥有 者 并 且 为 用 户 .组 或 其 他 成 员 设 置 了 
权 腿 位 ,来 控制 他 们 各 自 的 访问 权限 。 正 因为 有 如 此 特性 , 才 可 以 让 服务 器 具有 与 权限 而 客 
J Sig RO TSE AR PL 

多 个 客户 : AAR HKR A BAO MAAS AFR. 

BORA. 服务 器 通过 调用 一 个 运行 在 用 户 空间 的 库 函 数 strcpy 来 更 新 共享 的 内 存 段 。 
姐 果 客户 端正 好 在 服务 器 局 内 存 段 中 写 人 新 数据 的 时 候 来 访 癌 内 存 段 ,那么 它 可 能 易 读 到 
新 数据 也 读 到 老 数 据 , 

避免 竟 态 条 件 : 服务 器 和 客户 段 必须 使 用 相同 的 系统 来 对 资源 加 锁 ， 内 核 提供 了 一 种 
进程 间 加 锁 的 机 制 , 称 为 悦 号 量 机 制 。 在 下 一 节 中 将 会 学 习 这 种 机 制 。 


15.3.5 各 种 进程 间 通 信 方 法 的 比较 


最 初 的 问题 是 如 何 使 一 个 进程 从 男 一 个 进程 得 到 宁 符 串 。 前 面 提 刘 的 三 个 方法 都 可 以 
达到 要 求 。 客 户 关 从 服务 器 端 得 到 它们 想 要 的 数据 。 前 面 已 经 介绍 了 四 个 版 本 的 客户 / 服 
务 器 系统 ,甚至 还 可 以 写 出 使 用 数据 报 或 Unix 域 地 址 的 新 版 本 。 不 过 如 何 决定 到 底 用 哪 一 
RFE KS BLM? 有 什么 选择 标准 吗 ? 

(1) 速度 

通过 文件 或 命名 管道 米 传 输 数 据 需 要 更 儿 的 操作 。 系 统 内 核 将 数据 复制 到 内 核 空间 
中 ,然后 再 切换 回 用 户 空间 。 对 于 利用 文件 进行 传输 来 说 , 内核 将 数据 复制 到 磁盘 上 ,然后 
将 数据 再 从 磁盘 上 上 复制 出 去 ,实际 上 ,在 存储 器 中 存储 数据 比 想象 中 要 复杂 的 多 。 虚 拟 内 
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TEX Hf foie HI Ps app ms de qe SuSE d b. PP ub RE Hos vp RARE ee Y ERE DE 
的 读 写 操作 ， 

(2) 连接 和 无 连接 

文件 和 共享 内 存 段 就 像 公告 牌 一 样 。 数 据 产 生 者 将 信息 贴 在 公告 牌 上 ,多 个 消费 者 可 
以 同时 从 公告 牌 REA. FIFO 要 求 建立 连接 ,因为 在 内 核 转换 数据 之 前 ,读者 和 写 者 
都 必须 等 待 着 FIFO 被 打 和 ,并且 也 只 有 一 个 客户 可 以 阅读 此 消息 。 流 socket 是 面向 连接 
的 ,而 数据 报 socket 则 不 是 。 在 某 些 应 用 程序 中 ,这 些 区 别 起 着 关键 性 的 作用 ， 

(3) 范围 

你 希望 程序 中 的 消息 能 传送 多 远 的 距离 呢 ? 共享 内 存 和 命名 管道 只 人 允许 本 机 上 的 进程 
之 间 通 信 。 通 过 文件 进行 传输 可 以 允许 不 同 机 器 上 的 进程 进行 通 依 。 使 用 IP 地 址 的 socket 
可 以 与 不 同 机 器 上 的 进程 进行 通信 ,而 使 用 Unix 地 址 的 socket 却 不 能 。 这 样 ,使 用 瞩 -种 
方法 进行 通信 就 挨 决 于 通信 实体 问 的 中 离 了 。 

(4) 访问 限制 

你 是 希望 所 有 人 都 能 与 服务 髓 通信 还 是 只 有 特定 权限 的 用 户 才 行 ? 文件 .FIFO, 共 享 内 
存 以 及 Unix 地 址 socket 都 提供 标准 的 Unix 文件 系统 权限 。 而 Internet socket MAT. 

(5) 竞 态 条 件 

使 用 共享 内 存 和 共享 文 忻 要 比 使 用 管道 和 socket 麻烦 。 管 道 和 socket 是 由 内 核 来 管理 
的 队列 。 写 者 将 数据 放 进 一 端 ,而 读者 则 从 另 一 端 将 数据 读 出 ,进程 并 不 需要 考虑 其 内 部 
AI. 

然而 对 于 共享 文件 和 共享 内 存 的 访问 却 不 是 由 内 核 进行 管理 的 。 如 果 某 进程 在 读 文 件 
的 过 程 中 , 勇 一 个 进程 正在 对 文件 进行 重 写 , 读 进 程 读 到 的 很 可 能 就 是 不 完整 或 不 一 致 的 数 
据 。 下 一 节 将 会 介绍 文件 锁 和 信号 量 的 应 用 。 


15.4 进程 之 间 的 分 工 合作 


如 何 处 理 这 些 令 人 恼火 的 竟 态 条 件 呢 ? 客 六 和 服务 器 震 通 过 共享 文件 或 内 和 的 方式 来 
进行 通信 ,又 如 何 来 保证 它们 正常 运行 而 不 出 现 冲突 呢 ? 它们 如 何 分工 合 作 ? 本 节 将 介绍 
进 穆 在 访问 共 部 资源 时 所 使 用 的 技术 : 文件 锁 和 信号 量 。 


15.4.1 文件 锁 


1. 两 种 类 型 的 倘 

考虑 两 种 类 型 的 问题 。 育 先 , 当 客 忆 试图 读 取 文件 时 ,服务 器 正在 重 写 文件 ,结果 会 如 
何 呢 ? 客户 读 上 出 来 的 可 能 就 是 不 完整 的 数据 。 上 面 所 提 到 的 日 期 /时 辣 版 务 器 不 太 可 能 过 
到 这 个 问题 ,因为 其 消息 比较 短 , 重 写 时 间 较 少 。 但 如 果 是 天 气 预 报 服务 器 ,其 交互 的 消息 
比较 长 ,就 有 可 能 过 到 竞 态 问题 。 因 此 , 当 服 务 器 在 重 写 文件 的 时 候 , 窜 户 必须 等 竺 服务器 
完成 之 后 才能 开始 读 。 

再 考虑 一 下 正好 相反 的 情况 。 当 客户 正在 一 行 一 行 读 数据 的 时 候 ,服务 器 突然 把 文件 
抢 过 来 ,将 内 容 删 除 ,然后 开始 重 写 数据 。 客 户 端 看 着 文件 从 自己 眼皮 底下 被 抢 过 去 而 无 能 
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为 力 。 因 此 , 当 客 户 在 读 了 文件 的 时 候 , 服 务 喜 也 必须 等 待 客户 完成 ， 其 他 的 客户 不 必 去 
等 ,办 为 多 个 进程 一 起 读 文 件 不 会 带 来 任何 风险 。 

为 了 避免 这 些 问 题 , 需 要 两 种 类 型 的 锁 。 第 一 种 类 型 为 写 数 据 锁 , 它 告 诉 其 他 进程 :“ 我 
在 写 文件 ,在 完成 之 前 任何 人 都 必须 等 待 . ”第 二 种 类 型 的 锁 为 读数 据 锁 , 它 告诉 其 他 进程 : 
“我 在 读 文件 ,要 写 文 件 必 须 等 我 完成 ,要 读 文件 的 不 受 影响 。” 

2. AE Fl X: tr Ao ut fr R8 3X 

Unix 提供 了 3 种 方法 锁 住 打开 的 文件 : flock lockf 和 fcntl。 三 者 中 最 灵活 和 移植 性 最 
好 的 应 该 是 fcntl。 

下 面 使 用 fcntl Mxit, 

(1) 如 何 给 已 经 打开 的 文件 加 读数 据 锁 ? 

使 用 fentl(id, F_ SETLKW, S.lockinfo) 

第 一 个 参数 是 该 文件 对 应 的 文件 描述 符 。 第 二 个 参数 下 _SETI.KW 说 明 若 必要 的 话 , 可 
以 等 待 其 他 的 进程 释放 锁 。 第 二 个 参数 指 问 一 个 struct flock 类 型 的 变量 。 下 列 代 码 为 一 个 
文件 描述 符 没 置 读数 据 锁 ，; 





set read lockt int fd) 


i 
struct flock lockinfo; 


]ockinfo.l type = F RDICK; /* a read lock on a region */ 
lockinfo.l pid = getpid()-; /* for ME x/ 

lockinfo.l start = 0; ‘x starting 0 bytes from.. */ 
lockinfo.l whence = SEEK SET; /* start of file x/ 

lockinfo.1 len = 0; /* extending until EOF «/ 


fentl(fd,F SETLKW,&lockinfo) ， 


1 
r 


(2) 如 何在 打开 的 文件 上 却 写 数据 锁 ? 

使 用 fcntl(fd, F_SETLKW, &lockinfo) ,并 将 lockinfo. ] type  F WRLCK, 

(3) TEL FERRE? 

使 用 fentlCfd, F_SETLKW, &lockinfo? ,并 将 lockinfo.l type # F UNLCK, 

(4) 如 何 只 锁 住 文件 的 一 部 分 ? 

使 用 fcntl(fd,F_SETLKW, & lockinfo? ,并 将 lockinfo. | start BAA t6 fo EH ES ER 
fay ARF lockinfo. llen 置 为 区 域 的 长 度 ， 

3, 基于 文 忻 的 时 间 服 务 器 代码 


/* file ts.c - read the current date/time from a file 
* usage. file ts filename 
* action; writes the current time/date to filename 
* note; uses fentl() - based locking 


r 
E 


# include = stdio. h> 


ee P — MP — ee en ee EE ee Án eee aa — 4 


# include  «sys/file.h— 
4 include 二 fentl. h > 


# include < time. ho 
i define oops(m,x) | perror(m); exit(x); | 


main(int ac, char * av ]) 
| 

int fd; 

time t now; 


char * message; 


if (ac |= 274 
fprintf(stderr, "usage, file ts filename\n"); 
exit(1); 


j 
if ( (fd = open(av[1],O CREAT|O TRUNC|O WRONLY,0644)) == -1) 
oops(av[ 1],2)5; 


while(l) 
1 


time(&now); 


message = ctime(&now); /* compute time x/ 
lock _operation(fd, F WRLCKO; /* lock for writing */ 
if ( lseek(fd, OL, SEEK SET) == -13j 


oops( "lseek" 3): 
if ( write(fd, message, strlen(message)) == -1) 


oops( "write", 42; 


lock operetion(fd, F_UNLCK); /* unlock file x/ 


sleep(1); /* wait for new time #/ 


lock operation(int fd, int op) 


| 
struct flock lock; 


lock.l whence = SEEK SET; 
lock.l start = lock.l len = 0; 


lack.l pid = getpid(; 
lock.l type - op; 


if ( fontl(fd, F SETLKW, &klock) == -1) 


oops( "lock operation", 6); 
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4， 基 于 文件 的 时 间 服 务 客户 端 人 工友 


/* File tc.c 一 read the current date/time from a file 


* usage: file tc filename 
x uses; fecntl() — based locking 
xf 


4 include  «stdio.h-— 
# include «< sys/file. h> 
# include «< fentl. h> 


+ define oops(m,x) | perror(m); exit(x); } 
f define BUFLEN 10 


main(int ac, char *av[ |) 


i 
L 


int fd, nread; 
char buf| BUFLEN |; 


if (ac $= 2)| 
fprintf(stderr, "usage: file tc filename\n")- 


exit(1); 


if ( (fd= open(asv[1],0 RDONLY)) == -1 3 
oops(av[ 1,3); 


lock operation(fd, F RDLCK); 


while( (nread = read(fd, buf, BUFLEN)) > 0 } 


write(l, buf, nread }; 
lock operation(fd, F UNLCK); 


close(fd); 


lock operationtint fd, int op) 


1 


struct flock lock; 


lock.l whence = SEEK SET; 
lock.1l start = lock.l len = 0; 
lock, 1 pid = getpid(O; 
lock. 1 type = op; 


if ( fentl(fd, F SETLKW, Slock) == -1) 


oops( "lock operation", 6). 
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5. 文件 锁 : 小 结 

使 用 Ff SETLKW 参数 调用 fentl 可 以 使 进程 挂 起 直到 内 核 多 许 进程 设置 指定 的 锁 。 在 
读 取 数据 之 前 ,客户 必须 设置 读 取 数 据 的 锁 。 若 服务 器 对 文件 加 写 数 据 镇 ,客户 只 好 等 待 服 
务 器 完成 。 服 务 器 在 重 写 数据 之 前 ,也 必须 对 文 仁 加 写 数 据 锁 , 如 果 这 时 客户 加 了 一 个 读数 
据 的 锁 , 那 服务 器 会 被 排 起 直到 所 有 客户 释放 这 个 锁 。 

6, 重要 细节 : 进程 可 以 忽略 镇 机 制 

在 前 面 对 于 文件 锁 的 讨论 中 ,不 管 客户 还 是 服务 器 在 读 或 修改 文件 的 时 候 , 程 序 都 是 自 
觉 有 序 地 等 待 ,设置 及 释放 文件 锁 。 那 么 当 别 的 进程 设置 了 锁 的 时 候 , 其 他 进程 是 否 可 以 忽 
略 它 , 仍旧 继续 原来 的 讯 取 或 是 修改 操作 吗 ? 答案 是 肯定 的 。Unix 的 锁 机 制 允 许 进 程 通过 
这 种 方式 合作 ,但 并 不 强迫 它们 一 定 要 用 。 | 
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7 日 期 系统 中 的 文件 是 相同 的 。 前 面 介绍 了 用 锁 的 机 制 来 解雇 访问 文件 的 冲 帘 , 共 享 内 存 段 
如 何 来 避免 数据 冲突 呢 ? 在 共享 内 存 段 中 是 否 也 存在 着 读 数据 锁 和 写 数 据 镁 的 概念 ? 不 
是 ,但 进程 使 用 一 个 更 加 灵活 的 机 制 来 合作 , fase. 

信 汪 量 是 一 个 内 核 变 量 , 它 可 以 被 系统 中 的 任何 进程 所 访问 。 进 程 间 可 以 使 用 这 个 恋 
量 来 协调 对 于 共享 内 存 和 其 他 资源 的 访问 。 上 一 章 讨 论 了 如 何在 特定 的 情况 发 生 时 使 用 条 
件 变量 来 通知 其 他 线程 。 条 件 对 象 是 进程 中 的 全 局 变量 ,而 信号 量 则 是 系统 中 的 全 局 变量 。 

在 上 时间/ 日 期 服务 器 各 客户 端 程序 中 ,如 何 来 使 用 信号 县 呢 ? 

]. 计数 器 及 其 操作 

在 无 客户 读 取 的 时 候 , 服 务 带 将 数据 写 人 共享 内 存 段 中 。 同 样 地 ,在 服务 器 没有 对 共享 
内 存 段 进行 写 操 作 的 时 候 , 客 户 可 以 读 到 数据 。 可 以 将 这 些 规 则 转换 为 关于 变量 值 的 表 
AR: 

”客户 端 等 待 直 到 number of writers == 0 

« 服务 器 等 待 直到 number of readers == 0 

信号 量 是 系统 级 的 全 局 变量 ,这 里 可 汶 使 用 两 个 信号 量 分 别 代表 读者 数 和 写 者 数 。 管 
BESET BM PRE. l 

举例 来 说 ,读者 必须 等 待 写 老 数 为 零 的 时 候 , 才 可 以 将 读者 数 如 1。 当 某 读 者 读 完 数据 ， 
1 A AUM E 

[n] E Mb . E; p te PE ROA ERR A RIELFESS US 1. REAR ASL 
及 将 写 者 数 加 1 是 两 个 独立 的 操作 ,必须 分 开 执 行 , 即 这 两 个 操作 都 是 原子 操作 。 通 过 使 用 
信号 量 来 通信 的 进程 可 以 使 用 香干 个 这 样 的 变量 ,并 且 独 立地 进行 这 些 原 子 操作 。 

这 就 是 信号 量 机 制 的 工作 原理 。 进 程 可 以 同时 处 理 一 组 信号 量 上 的 多 个 操作 。 

2. 一 组 信号 量 、 多 个 活动 

时 间 服 务 器 系统 使 用 两 个 信和 号 量 ,如 图 15.8 所 示 , 并 且 读 者 和 写 者 需 同时 对 两 个 活动 集 
进行 操作 . 
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图 15.8 (g Stu E :num readers, num writers 


在 修改 共享 内 不 之 前 ,服务 器 必须 先 对 这 组 活动 集 进 行 操作 : 
。 [0] 等 候 num readers 变 成 0 

* [1] num writers 加 1 

当 服 务 右 完成 写 操作 之 后 , 它 必须 再 对 下 面 这 组 活动 集 进行 操作 : 
*[0] 将 num writers X ] 

ES P ERU SC PN ZA YOO FA A TR E ETRE : 
. [0] 等 待 num writers OKO 

a (1] 将 num readers ff 1 

2578 P SE I [E 35 SA BEM P DX EB 16 51 VETT MRE: 
*[0] $ num readers 7X 1 

3. 服务 器 版 本 : shm is2.c 

给 原来 的 程序 shm is. c 添加 信号 量 得 到 shm, t2. c; 


/* shm ts2.c - time server shared mem ver2 , use semaphores for locking 
^ program uses shared memory with key 99 

* program uses semaphore set with key 9900 

x/ 


R include  «stdio. h> 

# include <sys/shm. K> 

H include <tine. h> 

# include <sys/types. h> 
B include <sys/sem. h> 

# include <signal. h> 


H define TIME MEM KEY 99 /* like a filename +/ 
# define TIME SEM KEY 9900 
ftdefine SEG SIZE ((size t)100) /* size of segment »/ 


H define oops(m,x) { perror(m) ; exit(x) ; } 


unión semun ( int val ; struct sem3d ds * buf ; ushort w array; |]; 
int seg id, semset id; /* global For cleanup() «/ 


void cleanup( int); 


一 
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main) 
\ 
char * mem pLr, * ctime(); 


time t now; 


int n- 


F 


/* create a shared memory segment «/ 


seg id - shmget( TIME MEM KEY, SEG SIZE, IPC CREAT|0777 5; 
if ( seg id == -1) 
ocps("shmget", 1); 


/* attach to it and get a pointer to where it attaches «/ 


mem ptr = shmat( seg id, NULL, 0 2; 
if ( mem ptr == ( void * ) -1) 
oops("shmat", 2); 


/* create a semset, key 9900, 2 semaphores, and mode rw- rw- rw «/ 


semset id - semget( TIME SEM KEY, 2, 
(0665|IPC CREAT|IPC EXCL) ); 
if ( semset id == -1) 


Gopst"semget", 3); 


set sem valuet( semset id, 0, 0); /* set counters */ 


set sem value( semset id, 1, 0); /* both to zero x/ 
signal(SIGINT, cleanup}; 


/* run for a minute */ 
for (n=0; n60: n++ )« 
time( &now 5; /* get the time »/ 
printf¢"\tshm ts2 waiting for lock\n"}; 
wait and lock(semset id); /^* lock memory */ 


printf("Ntshm ts2 updating memory\n"}; 


strcpy (mem ptr, ctime(&now)); /* write to mem #/ 
sleep(5):; 
release lock(semset id): /* unlock */ 


printf("Atshm ts2 released lock\n"); 


sleep(1); /* wait a sec +’ 


Cleanup(0); 
i 


void cleanup(int n} 


| 
shmctl( seg id, IPC RMID, NULL ); /* rm shrd mem «/ 
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— — -一 下 一- 一 


semctl( semset_id, 0, IPC RMID, NUDI); /* rm sem set «/ 


-— m 


F 

* Initialize a semaphore 

xf 
set sem value(int semset id, int semnum, int val) 
i 


union gemun initval; 


initval.val - val; . 
if ( semctl(semset id, semnum, SETVAL, initval) == - 1) 


oops("semctl", 4); 


f 


i * 

+ build and execute a 2— element action set. 

* wait for 0 on n readers AND increment n writers 
af 


wait_and_lock{ int semset id } 


1 
struct sembuf actions[2!; /* action set x/ 
actions[0].sem num = 0, /* sem[ 0! is n readers «/ 
actions|0].sem flg = SEM UNDO; /* auto cleanup */ 
actions[|0|.sem op = 0; /* wait til no readers x/ 
actions|1].sem num = 1; /* Sem[ 1] is n writerg «/ 
actions[|1].sem flg = SEM UNDO; /* auto cleanup */ 
actians|l|.sem op = +1 ; /* incr num writers x/ 
if ( semop( semset id, actions, 2) == 一 1 ) 

ocops("semop. locking", 10); 
: 
i* 


* build and execute a 1 - element action set. 
* decrement num writers 
*/ 


release lnck( int semset id) 


1 3 


struct sembuf actions! 1]; /* action set */ 
actions[ 0 .sem num = 1; /* sem 0j is n writerS «/ 
actions[0].se» flg = SEM UNDO; /* auto cleanup */ 
actions[0].sem op = -1; /* decr writer count */ 


if ( semop( semset id, actions, 1) == -1 


oops("semop: unlocking”, 10); 


F 
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此 程序 中 ,使 用 信和 号 量 集 的 服务 器 必须 完成 下 面 的 5 个 步 又 。 

(D 创建 信号 划 集 

semset id = semget(key ! key, int numsems, int flags) | 

semget BA gis T — Pid numsems 个 信和 号 量 的 集合 。shm_ts2 程序 创建 了 包含 两 个 
信和 号 量 的 集合 。 此 集合 所 拥有 上 的 权限 模式 是 0666, K% semget 返回 此 信号 量 集 的 ID. 

(2) 将 所 有 的 信号 量 置 0 

semctl(int semset id, int semnum, int cmd, union semun arg? 

这 里 使 用 semel 来 对 信号 量 集 进 行 控制 。 此 函数 的 第 一 个 参数 是 此 集合 的 ID, 第 二 个 
参数 是 集合 中 某 特定 信号 量 的 号 码 , 第 三 个 参数 是 控制 命令 。 如 果 此 控制 命令 需要 参数 ,于 
么 使 用 第 四 个 参数 向 其 提供 所 需 的 参数 。 在 shm_ts2 中 ,使 用 SETVAL 命令 来 给 每 一 个 信 
SER- CHWEF, | | 

(3) 等 待 所 有 读者 完成 任务 之 后 ,服务 器 将 num, writers fil 1 

semop(int semid, struct sembuf * actions, size t numactions) 

PREX semop 对 信和 号 量 集 完成 一 组 操作 ， 第 一 个 参数 用 来 指定 信号 量 集 。 第 二 个 参数 是 
一 组 活动 的 数组 .最 后 一 个 参数 则 是 该 数组 的 大 小 。 集 合 中 的 每 一 个 活动 都 是 一 个 结构 
体 , 它 的 作用 就 是 使 用 选项 sem_flg 来 完成 对 号 码 为 sem. num 的 信号 量 的 操作 sem. op". 
整个 活动 集合 被 作为 组 来 完成 ,这 一 点 是 关键 。 上 面 程序 中 的 函数 wait and lock 完成 两 个 
操作 : 等 待 读者 数 到 零 , 然 后 将 写 者 数 加 1。 这 里 建 了 一 个 包 例 这 两 个 活动 的 数组 。 活 动 0 
所 要 完成 的 事情 就 是 “等 待 信号 量 0 变 成 0”。 而 活动 1 要 完成 的 功能 则 是 “将 信号 量 1 加 
i"。 进 程 挂 起 直到 这 两 个 活动 都 被 完成 。 只 要 读者 计数 器 一 变 成 0, 写 者 计数 器 立即 本 1, 然 
后 semop Ñ 2X28 |e]. | | 

使 用 SEM. UNDO fj d nit PITE fe dt Ee iE IB BU INI PK ERE. E ETE X TURF 
中 , 当 写 者 计数 器 被 加 1 的 时 候 , 共 享 内 存 自 是 被 锁 住 的 。 如 果 在 对 此 计数 器 做 减 1 操作 之 
前 ,进程 非法 终止 ,其 他 进程 则 永远 无 法 读 取 共享 内 存 段 的 内 容 了 ， 

(4) 对 num writers 减 ] 

在 release lock 函数 中 ,只 需 完成 一 件 事 情 ; 对 写 者 数 减 ]。 这 里 使 用 一 个 只 包含 该 活 
动 的 数组 作为 参数 来 调用 semop 函数 ,从 而 完成 对 写 者 数 旭 的 修改 。 如 果 这 时 某 客户 正在 
等 待 , 它 立 即 就 可 以 继续 执行 读 操 作 了 。 

(5) 删除 信号 量 

semctl(semset id, 0, IPC RMID, 0) 

任务 完成 之 后 ,服务 器 再 次 调用 semet] 函数 o jd ix Xn E B9 JEN E 9 dE. 

4. 客户 端 程 序 : shm_tc2.c 

客户 端的 设计 相对 容易 得 和 多。 在 程序 shm_tc 中 , 既 不 初始 化 信号 量 也 不 删除 它们 。 


/* ghm tc2.c — time client shared mem ver2 ; use semaphores for locking 


* program uses shared memory with key 99 
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* program uses semaphore set with key 9900 


, 


# include  —stdio.h-- 

# include < sys/shm. h> 
# include «time. h> 

4 include < sys/ types. h> 
# include «{sys/ ipc. h> 


# include < sy3: sem. h> 


H define TIME MEM KEY 99 /* kind of like a port number */ 
i define TIME SEM KEY 3900 /* like a filename x/ 
# define SEG SIZE t(size t2)100) /* size of segment x/ 


# define oops(m,%) | perror(m); exit(x); | 


. ushort * array: 1; 


F , 


union semun 1 int val ; struct semid ds «* buf 


main) 
| 
int seg id; 
char «mem ptr, * ctime(); 
long now: 
int  semset id; /* id for semaphore set x/ 


/* create a shared memory segment «/ 


seg id = shmget( TIME MEM KEY, SEG SIZE, 0777 ): 
if ( seg id == -1) 
oops( "shmget", 1); 


/* attach to it and get a pointer to where it attaches +/ 


mem ptr = shmat( seq, id, NULL, 0 ?; 
if ( mem ptr == ( void +} - 1) 
oops( "shmat",2); 


/* connect to semaphore set 9900 with 2 semaphores */ 


semset id = semget( TIME SEM KEY, 2, 0); 


wait and lock( semset id }; 
printf( "The time, direct from memory; .. *& s", mem ptr): 


release lock( semset id); 
shmdt( mem ptr >; /* detach, but not needed here x/ 


fx 
* build and execute a Z- element action set: 
* wait for 0 on n_writers AND increment n_readers 


x/ 
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wait and lock( int semset id ) 

1 
union semun sem info; ie 
struct sembuf actions| 2]; ix 
actions} 0 |.sem_num = 1; is 
actions|0:.sem flg = SEM UNDO; fa 
actions| 0].sem op = 0; fx 
actions|l].sem num = 0; fx 
actions[1].sem flg = SEM UNDO; ix 


actions[1].sem_op = +1; fx 


if € semop( semset id, actions, 2) == 一 | ) 
oops("semop; locking", 102; 


| 


/* 
* build and execute a 1 — element action set, 
* decrement num readers 
xf 
release lock( int semset id ) 
| 
union semur sem info; - jx 
struct sembuf actions[ 1]: {x 
actions] 0]. sem_num = 0; fo 
actions[0,.sem flg = SEM UNDO; fx 


actionsLO].sem_op = -1; E 


if ( semop( semset id, actions, 1) == -1 ) 


oops("semop; unlocking", 10}; 


—— 


编译 并 对 程序 做 如 下 的 测试 : 


5 cc shm ts2.c - o shnserv | 

5 cc shm tc2.c - o shmclnt 

5 ./shnservk 

[1] 15533 
shm ts2 waiting for lock 
shm_ts2 updating memory 
shm ts2 released lock 
shm t52 waiting for lock 
shm ts2 updating memory 

5 ./Shmclnt 

shm ts2 released lock 


some properties x*/ 
action set *, 

sem|1] is n writers */ 
auto cleanup «/ 

wait for 0 x; 

sem| 0| is n readers */ 
auto cleanup */ 


incr n readers */ 


some properties x, 
action set x/ 

sem[0] is n readers */ 
auto cleanup */ 


decr reader count */ 


The time, direct from memory. ..Sat Oct 27 17,36,34 2001 


$ shm_ts2 waiting for lock 
shm tsZ updating memory 
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s ./shmcint 
shm ts? released lock 
The time, direct from memory; .. Sat Oct 27 17,36;40 2001 
S shm 七 S2 waiting for lock 
ipes 
"uS Shared Memory Segments 一 一 一 一 一 一 一 一 
key shmid owner perms bytes nattch status 
0x00000053 30670854 bruce 777 100 1 
-:=---—-— Semaphore Arrays -一 一 一 一 一 一 一 
key shmid Owner perms  nsems status 
0xQ00026ac 262146 bruce 666 2 
… 一 一 一 一 一 Message Queues 一 一 一 一 一 一 


key msqid owner perms used— bytes messages 


S shm_ts2 released lock 
shm ts2 waiting for lock 
$ kill - INT 15533 


5 semop, unlocking; Invalid argument 


上 面 对 程 序 的 测试 展示 了 客户 端 如 何等 待 服务 器 解锁 。 许 多 客 户 可 以 同时 运行 ,每 一 
客户 等 待 服务 器 计数 器 变化 到 0, 然 后 对 客户 计数 器 加 1。 如 果 三 个 客户 同时 从 共享 内 存 中 
读 取 数据 ,读者 计数 器 也 将 是 三 个 。 服 务 器 只 好 等 二 个 客户 的 读者 计数 器 都 变 为 0 时 , 才 可 
以 进行 数据 的 与 操作 . 

程序 中 并 没有 对 可 能 出 现 的 所 有 情况 进行 处 理 。 具 钵 来 说 ,如 何 防止 两 个 服务 器 程序 
同时 运行 ?在 我 们 的 程序 中 ,服务 器 仅仅 等 待 客户 的 读者 服务 器 变 为 0 而 并 没有 对 其 他 服务 
器 的 写 者 计数 器 进行 判断 ，。 

5. FRR ELEAL 

客户 端 等 待 着 服务 器 的 所 者 信号 量 窜 为 零 , 而 同时 服务 器 等 待 着 客户 端的 读者 信和 叶 量 
变 为 零 。 仍 在 其 他 的 程序 中 ,也 许 希 户 等 待 的 是 某 个 信和 号 量变 成 正 数值 。 举 例 来 说 ,也 许 希 
望 等 待 售 号 量 的 值 变 为 2。 如 何 来 写 这 样 的 程序 呢 ? 

这 里 使 用 一 个 不 太 直 接 的 方法 : 让 系统 内 核对 信和 号 董 做 减 2 操作 。 信 和 号 量 不 允许 为 负 
值 , 因 此 系统 内 核 将 调用 挂 起 直到 芒 号 量 的 值 大 于 或 等 于 2。 信 号 量 一 Bik? 2, 某 进程 就 对 
EROR 2 操作 ,然后 把 任何 其 他 要 对 这 个 信号 量 减 2 的 进程 扶 起 。 

这 个 操作 的 sem_op 成 员工 作 方 式 如 下 。 

* 4 sem op 是 正 值 ,活动 : 通过 sem op FX [ES E 2. 

a di sem op 是 毒 ,活动 : 挂 起 直到 信号 景 等 于 0。 

* 4 sem op 荐 负 值 ,活动 : 挂 起 直到 信号 量变 成 止 值 ， 


15.4.3 socket 及 FIFO 与 共享 的 存储 


本 草 的 前 面部 分 写 了 四 个 版 本 的 时 间 / 日 期 服务 器 和 客户 端 程序 。socket 版 本 和 FIFO 
版 本 要 相对 容 铭 些 。 客 户 问 连接 到 服务 器 ,服务 器 发 送 数据 ,然后 服务 器 进程 挂 起 。 虽然 共 
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锁 和 信号 量 也 是 相当 复 厅 的 一 件 事 ， 

然而 文件 和 共 京 内 存 机 制 允 许多 客户 端 同时 从 服务 器 读 取 数据 ,允许 客户 端 和 般 务 咒 
在 不 同 的 时 刻 运 行 , 并 且 当 进程 由 尘 时 ,人 允许 数据 的 保持 和 斤 复 。 

Hin HI socket 也 包含 了 锁 的 机 制 。 管 道 和 socket 其 实 也 是 保存 数据 的 内 存 段 . 它 将 数 
据 从 源 端 复制 到 目的 端 。 不 同 的 是 管道 和 socket rp 69 gi pfi S LAR. TER d h UE ER 
来 管理 的 。 


15.5 打 M id 


TE BS T8] A STER vh IRS 8 2 LR SP. FR IL Oh AE HD ELLE K fa] 6 
JALE: 多 客户 端 发 数据 给 服务 器 ,例如 打印 服务 器 上 的 打印 池 。 那 么 这 种 类 而 的 程序 如 
何 来 设计 呢 ? 


15.5.1 多 个 写 者 、 一 个 读者 
如 图 15.9 所 示 .多 用 户 共享 一 个 打印 机 。 AD fef (8 FH 7e P1 3m / 服务 器 模型 来 设计 一 个 共享 
打印 折 的 程序 呢 ? 多 个 用 户 可 能 会 在 同时 发 送 打 印 请 求 ,但 是 打印 机 在 其 一 时 刻 只 能 打印 


一 个 文件 。 打 印 程序 就 必须 接收 多 个 并 发 的 输入 ,并 将 单个 的 输出 流 送 到 反 印 设备 上 。 如 
何 来 写 这 个 服务 器 程序 呢 ? 它们 之 问 叉 如 何 遂 信 呢 ? 





个 打印 机 打印 机 任务 队列 ”一 些 同步 的 打印 机 请 来 
IE 15.9 多 个 数据 源 . 一 个 打印 机 


这 个 程序 由 鄂 些 功能 单元 组 成 ”这 些 单元 之 间 又 传 遂 嘱 些 数 据 和 消息 呢 ? 





printer 





5.10. dE T (EFE SFT ED BL 


f£ Unix RA rp TED c fr 60 f (5j 3677 13: B 3e 68 BF p. 


cat filename > /dev/lpl 或 者 cp filename /dev/lpi 


M 
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x HL /dev/lpl 是 打印 机 设备 文件 的 名 称 ， 当 然 系统 中 打印 设备 文件 名 称 并 不 一 定 和 上 
面 的 一 样 ,但 在 Unix 系统 中 将 数据 传 给 打印 机 或 其 他 设备 的 惟一 方法 就 是 通过 open FIA 
文件 ,然后 使 用 write 系统 调用 将 数据 写 至 打印 文件 中 。 

可 以 使 用 号 数据 锁 吗 ? 

大 家 已 经 学 习 过 写 数 据 锁 和 信和 号 量 机 制 了 。 为 什么 不 可 以 自己 写 一 个 cat 或 cp 的 打印 
程序 ,让 它 通过 写 数据 锁 来 防止 对 设备 文件 的 同步 访问 冲突 呢 ? 

基于 锁 机 制 的 文件 复制 程序 确实 没有 问题 。 考 虚 一 下 对 打印 机 加 锁 后 ,结果 会 怎样 ， 
若 某 径 序 对 打印 机 加 锁 , 其 他 的 文件 复制 程序 都 必须 挂 起 等 竺 第 一 个 程序 完成 任务 并 料 放 
锁 。 那 么 下 一 步 娜 个 程序 执行 呢 ? 内 核 将 所 有 挂 起 进程 中 的 一 个 唤醒 ,但 是 这 个 进程 却 不 
一 定 就 是 排 在 第 二 的 。 显 然 这 样 的 次 定 有 失 公 平 。 人 允许 用 户 通过 复制 数据 到 打印 设备 文件 
来 实现 打印 还 有 另 一 个 问题 , 者 有 些 人 试图 作假 ,他 们 可 以 不 使 用 这 样 一 个 加 锁 的 程序 来 打 
印 。 第 三 个 问题 则 是 某 些 文件 需要 特殊 的 处 再。 例如 图 像 文件 有 可 能 需要 被 转换 为 打印 机 
可 以 看 得 懂 的 图 像 命令 。 很 多 用 户 并 不 知道 如 何 将 数据 转换 成 通用 的 格式 ,那么 他 们 号 得 
不 到 正确 的 结果 。 然 而 这 所 有 的 问题 都 可 以 由 集中 化 (客户 /服务 器 模式 ) 来 解决 。 


15, 5.2 客户 /服务 器 模型 


程序 的 客户 /服务 器 模型 解决 了 前 面 提 到 过 的 打印 的 问题 。 只 有 一 种 称 为 线性 打印 炎 
R (line printer daemon) 的 服务 器 程序 有 权限 去 写 数据 到 打印 设备 文件 中 ,而 其 他 的 用 户 进 
程 则 不 行 (如 图 15.11 所 示 )。 当 用 户 需 要 打印 文件 的 时 候 , 他 们 运行 一 个 称 为 Ipr 的 客户 端 
程序 。lpr 对 文件 做 了 一 个 复制 ,然后 将 复制 的 文件 放 在 打印 任务 队列 中 。 用 户 可 以 删除 或 
编辑 这 个 文件 。 并 且 打 印 精 灵 程 序 可 以 将 图 片 和 格式 做 转换 以 使 得 它们 能 够 正确 地 被 打印 
出 来 。 





client 





图 15.11 P/R ARDIE RE 


Zr J^ Seat FOIS Ha AN fef fa 87 它们 交互 哪些 数据 ? Te? fur Er x He 18 TR 2p 28 5 JC 
Be FD TES PA S SET 如果 服务 器 和 客户 不 是 在 同一 台 机 器 上 ,情况 又 将 如 
fap? 这 是 否 影响 到 对 通信 方式 的 选择 呢 ? 不 同 版 本 的 Unix 中 有 不 同 的 打印 系统 有 些 使 用 
socket ,有 些 使 用 命名 管道 ,而 男 外 一 些 仅 使 用 fork 和 文件 。 

古 否 使 用 集中 化 的 客户 /服务 器 模式 就 可 以 不 使 用 镇 机 制 来 避 钢 冲突 了 ?7 可 以 把 系统 
设计 成 一 个 通过 构件 进行 通信 和 合作 的 模型 来 打印 一 台 机 器 上 的 文件 ,也 可 以 用 来 打印 
Internet. 上 的 文件 。 可 以 将 你 自己 的 思路 和 不 同 版 本 的 Unix 打印 系统 的 设计 思路 做 一 个 
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比较 。 
15.6 3A W IPC 


李 音 已 经 介绍 过 各 种 形式 的 进程 间 通 信 方 法 。 下 面 是 一 个 小 结 . 


FE 是 否 可 以 使 用 在 不 同 的 进程 
不 同 机 器 上 
exec, wait 
environ 
pipe 
kill-signal 


inet socket 
inet socket 


Unix socket 


M ——MMÁ—————— 


Unix socket 
named pipe | 
shared mem 
msg queue 
files 
variables 

file locks 
semaphores 


Mttexes 


link 
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内 容 说 是 : 

FC 一- 父子 关系 

Sib— -MEXE 

Unrei- -无关 进程 

M- -RAME 

S— AeA p de 
R -— Bá HL ix RUN d 

C—- -用 来 使 任务 同步 或 人 台 作 
+ 一 -适当 的 应 用 

? 一 . -不 适当 的 应 用 

N- —jà GM AE PRESS PER EE TF 


上 面 的 这 张 表 并 不 包 售 贝尔 实验 室 的 网 络 工 具 TLI 以 及 它 的 后 续 产 品 。 
解释 如 下 : 


e lork-execv- argv exit- wait 


一 一 一 CO 一 一 一 一 
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用 于 使 用 一 组 参数 来 调用 其 个 程序 ,被 调用 疼 数 将 一 个 整 型 值 返回 给 其 调用 者 。 父 进 
T np] fork 来 创建 一 个 新 的 进程 。 在 此 新 进程 中 的 程序 可 以 通过 调用 execv 来 运行 新 
的 程序 ,并 传递 给 新 程序 一 组 套数 。 于 进程 通过 使 用 exit 传 回 一 个 返回 什 ; 同 时 父 进程 使 用 
wait 米 接 收 这 个 返回 值 ， 

这 一 组 调用 是 面向 消息 的 ,它们 仅仅 可 以 使 用 在 相关 的 进程 中 , 且 只 能 在 单机 上 使 用 ， 

* environ 

系统 调用 exec 通过 一 -个 叫做 environ HAAS Jesi Bi BRAS ARR ANE 
序 中 。 此 方法 允许 进程 传 值 给 子 进程 。 由 于 整个 环境 被 复制 给 子 进程 , 子 进 程 无 法 改变 父 
进程 的 运行 下 境 ，。 | 

此 方法 也 是 面向 对 象 的 . 单 站 的 ,仅仅 可 以 使 用 在 相关 的 进程 中 , 且 只 能 在 单机 上 个 用 . 

* pipe 

管道 是 由 进程 创建 的 单 同 数据 流 。 它 包含 连接 到 内 核 上 的 文件 描述 符 . 写 进 一 个 文件 
描述 符 的 数据 可 以 从 另 一 个 文件 描述 符 访 出来。 恕 果 进 程 在 创建 管道 之 后 调用 了 fork, RA 
新 的 进程 就 可 以 通过 间 样 的 管道 读 与 数据 ， 

此 方法 是 面向 流 的 ,通常 为 单 向 传输 ,也 仅仅 可 以 使 用 在 相关 的 进程 中 ,有 旦 只 能 在 单机 
上 使 用 。 

* kill— signal 

信号 (signal) 是 一 条 从 一 个 进程 发 往 另 一 个 进程 的 整 型 消息 (使 用 kil 系统 调用 )。 接 收 进 
程 可 以 通过 使 用 signal 系统 调用 来 安排 一 个 处 理 者 隔 数 ,此 隔 数 在 信号 到 来 的 时 候 被 调用 ， 
此 方法 是 面向 消息 的 ,大 -- 时 刻 单 铅 的 ,进程 必须 拥有 相间 的 用 户 ID, 且 只 能 在 单机 上 
使 用 。 | | | 

* [nternet sockets 

Internet sockets 是 这 样 一 条 链接 , 它 的 两 个 端点 是 通过 特定 的 端口 导 建 立 起 来 的 。 字 
TRG socket 进行 传输 ,从 一 个 进程 到 达 男 一 个 进程 ,类 似 于 基 人 在 波士顿 打 电话 给 在 东 
n HSHH A. Internet sockets 有 两 种 主要 的 实现 方式 ; M socket RII socket, RMB 
nf LA XX ISI fet. HL socket 更 类 似 于 文件 描述 符 :, 程序 员 使 用 write 和 read 调用 来 发 送 和 接 
收 数据 。 数 据 报 socket 则 类 似 于 明信片 ; 写 者 将 缓存 中 的 一 块 数据 发 给 读者 。 所 有 的 交互 
者 是 以 数据 缓存 的 形式 完成 ,而 不 是 字 节 流 。 

有 面向 消息 和 面向 流 两 个 版 本 ,双向 传输 ,可 以 在 无 关 进 程 中 使 用 ,可 以 通过 网 络 传输 
数据 . 

* Named Sockeis 

命名 socket, LIK Unix 域 socket。 它 使 用 文件 名 作为 地 址 而 不 是 主机 名 一 端口 号 对 。 
命名 socket 同时 支持 流 和 数据 报 版 本 。 因 为 这 种 方式 使 用 文件 名 而 不 基 主 机 一 端口 作为 地 
址 ,所 以 它们 民 似 可 以 连 拉 同一 机 只 上 的 进程 ， | 

这 种 方法 有 而 向 消息 和 面向 流 两 个 版 本 ,双向 传输 ,可 以 在 无 关 进 程 中 使 用 ,只 能 工作 
在 单机 上 上。 

* Named Pipes( FIFOs) 

命名 管道 的 工作 方式 类 似 于 一 个 常规 管道 ,但 是 它 可 以 连接 黄 个 无 关 的 进程 。 命 名 管 
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道 由 文件 名 来 标志 。 写 者 使 用 open 调用 来 打开 文件 并 写 数 据 , 读 者 同样 使 用 open 调用 打开 
文件 读数 据 。 这 种 方法 比 命名 socket 使 用 起 来 方便 很 多 , 候 是 它 只 可 以 单 向 传输 。 

此 方法 是 单 向 传输 的 . 面 癌 流 的 ,可 以 连接 无 闫 进程 ,只 能 工作 在 单机 上 。 

* File Locks 

Unix 人 允许 进程 对 文件 的 访问 设置 锁 。 进 程 可 以 对 文件 的 某 一 段 加 锁 , 使 自己 可 以 单独 
地 对 这 一 段 进行 改动 。 另 一 个 试图 锁 住 此 文件 的 进程 将 被 挂 起 ,直到 这 个 文件 被 解锁 。 文 
件 锁 机 制 允 许 进 程 间 进行 通信 ,让 所 有 的 进程 都 知道 是 哪 一 个 进程 正在 读 取 或 覆 改 文件 。 
这 里 可 以 使 用 系统 调用 flock. lockf 和 fcntl 来 设置 或 测试 文件 锁 。 在 某 些 系统 中 ,这 些 锁 是 
被 强制 加 上 的 。 

这 种 方法 面 癌 消息 ,多 个 无 关 进 程 间 可 以 同时 交互 ， 但 只 能 在 单机 上 工作 

¢ Shared Memory 

每 个 进程 都 有 其 自己 的 数据 空间 。 程序 所 定义 的 任何 变量 或 在 运行 时 刻 分 配 的 空间 都 
只 有 对 该 进程 是 可 见 的 。 进 程 可 以 通过 使 用 shmget 和 shmat 调用 来 他 建 可 以 被 多 个 进程 
共享 的 内 存 段 。 由 一 个 进程 写 人 共享 内 存 段 的 数据 可 以 被 别 的 对 此 内 存 段 有 访 澡 权限 的 进 
程 读 出 。 这 是 IPC 中 最 为 有 效 的 一 个 方法 ,因为 所 有 的 通信 并 不 需要 数据 的 传输 。 

此 方法 面向 随机 访问 ,多 个 无 关 进 程 问 可 以 同时 交互 ,但 只 能 在 单机 上 工作 ， 

* Semaphores 

信号 量 是 系统 级 的 变量 ,程序 之 间 可 以 通过 信和 号 量 来 进行 通信 。 进 程 可 以 对 信号 量 做 
增 1 操作 , 减 1 操作 或 等 待 信号 量 到 茶 个 特定 的 值 。 信 号 量 类 似 于 许可 证 服务 器 上 的 许可 
证 。 当 进程 需要 使 用 资源 的 时 候 , 它 对 信号 量 做 减 1 操作 (到 一 个 许可 证 );。 如 果 此 时 许可 证 
已 经 用 完了 ,进程 挂 起 直到 其 他 进程 对 信和 号 量 敌 了 增 1 操作 。 信 号 量 应 用 在 各 种 各 样 的 程 
序 中 ， 

ile 77 23; T A [93 TE LE eI JC OR EP A [e] p 22 ER BE EL FLUTE. 

* Message Queues 

1 AS BAS AY CE RAT FFO BEA EAE A PEE. BERET EUBE TS, Ol 
队列 中 ,然后 由 其 他 进程 将 数据 从 有 队 齐 中 取出 。 多 个 队列 可 以 被 多 个 进程 所 共享 

这 种 方法 是 面向 消息 的 . 单 向 传输 的 , 且 只 能 工作 在 单机 上 。 

* Files 

文件 可 以 被 多 个 进程 得 同一 时 刻 打 开 。 如 有 果 某 进程 将 数据 写 和 人 一 个 文件 ,另外 的 进程 
可 以 从 该 文件 中 读 出 数据 。 车 大 家 者 使 用 一 个 经 过 巧妙 设计 的 交互 协议 ,很 多 复杂 的 通信 
都 可 以 通过 古老 的 文件 机 制 来 实现 ， 

此 方法 面 癌 随机 访问 ,多 个 无 关 进 程 间 可 以 同时 交 号 ,网络 文件 系统 CNFS) 可 以 支持 路 
机 器 的 多 进程 通信 。 | 


15.7 连接 与 游戏 


本 章 介 绍 了 很 多 进程 之 间 传 递 数据 的 方法 。Unix 的 系统 内 核 管理 着 进程 、 交 件 和 设备 ， 
并 且 对 管道 ,socket ,文件 ,共享 内 存 以 及 信号 进行 操作 使 它们 可 以 传输 数据 。 对 于 某 些 程序 
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eit. eae EE He HAH He RE CE BE. 

Unix 的 开发 者 之 一 Ken Thompson, E 1978 FH 3B ; 

“与 其 说 Unix 的 内 核 是 一 个 完整 的 操作 系统 ,还 不 如 说 它 是 个 LO SRE A a 
(multiplexer) 。 从 这 种 观点 出 发 ,许多 其 他 操作 系统 中 的 特征 在 Unix 内 核 中 是 找 不 到 的 
err 这 许多 的 功能 都 是 由 用 户 程序 使 用 内 核 调 用 来 实现 的 .5 

在 第 1 章 中 ,讨论 了 命令 bc. 一 个 Web 服务 器 还 有 一 个 网 络 桥牌 游戏 。 接 着 写 了 一 个 
bc 程序 和 疯 个 Web 服务 器 程序 ， 那 么 如 何 写 了 网络 桥牌 游戏 呢 ? 可 以 使 用 屏幕 控制 程序 来 
作为 用 户 界面 ,使 用 socket 来 连接 两 端 。 那 么 哪 一 端 是 服务 器 ? 哪 一 端 是 客户 呢 ? 如 何 使 
用 锁 机 制 ? 你 所 需要 的 所 有 的 技术 都 包 会 在 本 书 的 章节 中 。 在 Unix 上 进行 编程 并 没有 想 
象 中 的 那么 难 , 可 是 也 并 非 是 一 件 容 易 的 事 。 

说 到 游戏 和 网 络 , 让 我 们 回忆 一 下 Dennis Ritchie FE SIS E SR ERES 出 Unix 的 空间 
探险 游戏 的 ， 

“最 开始 写 在 Multics 系统 上 .……… ,这 并 不 亚 于 对 太阳 系 诸 星体 运动 的 模拟 。 你 还 必须 
让 玩家 和 铝 驶 着 太空 船上 四 处 近视 ,观看 空间 的 景色 并 且 可 能 在 行星 或 其 上 星 上 登录 。” 

驾驶 着 太空 船 四 处 近视 ,观看 空间 的 景色 并 且 可 能 在 行星 或 其 卫星 上 登录 不 就 像 生活 
中 的 网 络 冲浪 一 样 吗 ? 可 能 冲浪 并 不 是 最 好 的 比喻 。 但 是 确实 人 们 打开 他 们 的 浏览 器 ,到 
ERARE. Web 服务 器 将 各 处 的 景象 返回 。 人 们 使 用 telnet、ssh 还 有 ftp 登录 到 其 他 
机 器 上 。 也 许 Internet 恰巧 就 是 Ritchie 和 Thompson 在 1969 年 开始 模拟 的 广 阐 空间 的 实 
Pu np ! 
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l. 主要 内 容 

评 多 程序 都 包含 一 个 或 多 个 进程 ,进程 间 通 过 共享 数据 或 传递 数据 进行 通信 。 人 举例 

SEE PAT AH EH Unix 的 talk 命令 进行 对 话 , 他 们 就 运行 了 两 个 进程 ,将 数据 

从 键盘 和 socket 传输 到 屏幕 和 socket, 

某 些 进程 需要 从 多 个 源 端 接收 数据 ,并 将 数据 送 到 多 个 目的 地 。sekiecet 和 poll 调用 多 

省 进程 等 待 多 个 文件 描述 符 的 输 人 。 

Unix 提供 了 许多 方法 来 进行 数据 在 进程 间 传 输 。 命 名 管道 和 共享 内 存 是 同一 机 器 

上 的 进程 间 通 信使 用 的 两 种 技术 。 通 信 方 法 的 区 别 在 于 它们 的 速度 .所 传输 的 消息 

类 型 所 需 的 范围 .限制 访问 权限 的 能 为 以 及 防止 数据 冲突 的 能 力 ， 

。 文件 锁 是 进程 间 使 用 的 避免 对 文件 访问 冲突 的 技术 。 

*。 和 护 号 量 是 进程 合作 时 所 使 用 的 系统 级 的 变量 。 进 程 挂 起 等 待 另 一 一 进程 改变 信号 量 
的 值 。 

2. "F— WW 4E Z 

SY Unix 系统 编程 的 最 好 的 办 法 就 是 不 断 的 读 程序 ,与 程序 。 大 家 可 以 在 网 上 找到 大 


* 


(D “Unix implementation” Bell Sysrem Technical Journal, vol, 58, no. 6. 1978. 
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,以 及 介绍 Unix 内 部 实现 和 编程 接口 的 书籍 。 大 家 多 注意 一 下 每 天 都 使 用 的 程序 


壕 有 一 些 吸 引 你 的 新 程序 。 通 过 使 用 ,学 习 , 并 且 径 常 自 己 来 实现 一 些 已 经 存在 的 程序 ,就 
可 以 更 深 、 更 精 、 更 广泛 地 了 人 解 Unix 的 编程 了 。 
3， 习 题 


15. 1 


在 talk 程序 中 ,为 何不 用 线程 从 文件 描述 符 中 读 取 数据 呢 ? Ba 
dB 读 取 数据 ,而 另 一 线程 从 socket 读 取 数据 。 HIE BARE TRAE S 
39 AR 16 jr [5] i8 95 7 


talk E Fr ERER I e AERE E ie GRUT n T IH CE Po t COS, 9 BK 
fast. (EAR EIR socket 的 优 缺 点 各 是 什么 ? 


基于 FIFO 的 时 间 上 服务 器 在 执行 到 date > /tmp/time fifo 的 时 候 挂 起 直到 某 一 
客户 端 打开 FFO 来 读 取 数据 。 苦 服务 器 挂 起 的 时 间 很 长 ,客户 端 是 在 服务 器 挂 
起 时 能 够 接收 到 时 间 还 是 在 服务 器 被 蜡 醒 的 时 候 能 接收 到 时 和 间 ? 为 什么 ? 


看 一 下 系统 调用 mmap。mmap 将 文件 的 某 一 段 模拟 成 内 存 中 的 一 个 数组 ,从 而 
允许 程序 不 使 用 Iseek 就 可 以 对 文件 进行 随机 的 访问 。 使 用 mmap 与 使 用 文件 
或 共享 内 存 的 方式 来 实现 进程 间 通 信 有 何 区 别 ? 和 别 的 方法 相 比 ,使 用 mmap 
MBSR? 


tak 中 包含 了 两 个 相连 的 进程 。 使 用 -一 下 taik ,看 一 看 连接 是 如 和 何 建立 的 ?其 中 
X ga 3 mq P 
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参考 sclect 和 poll il Fd 89 f& FH EE ,看 看 你 的 系统 中 是 否 都 支持 。 在 有 些 系 统 
中 ,其 中 一 个 是 真 的 系统 调用 ;而 另外 一 个 则 是 由 那个 真 的 系统 调用 模拟 出 来 
Hj. A poll 来 重 写 程序 selectdemo. c. 


编号 使 用 下 列 方法 的 时 间 / 日 期 服务 器 和 客户 端 程序 。 
C1) 使 用 IP 地 址 的 数据 报 socket, 
(2) 使 用 Unix 域 地 址 的 流 socket, 


编写 基于 FIFO 的 时 间 / 日 期 服务 器 各 客户 端 程序 ， 


多 个 共享 内 存 的 服务 器 : 

C 可 坟 存 同一 时 刻 运 行 两 个 共享 内 存 的 服务 器 吗 ” 为 什么 ? 懒 一 下 试验 。 

(2) 修改 服务 器 程序 中 和 的 watt and lock 函数 ， Pen ae ne OT 
HAR #82 ELE O., 


在 使 用 文件 的 版 木 中 ,用 文件 锁 来 保护 对 共享 文件 的 访问 。 重 写 此 程序 ,用 信 
号 量 来 代 蔡 文件 锁 。 


在 使 用 共享 内 存 的 版 本 中 ,用 信号 量 来 保护 对 共享 内 存 的 访问 。 重 写 此 程序 ， 
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用 文件 镇 来 着 代 信 和 号 量 。 当 然 这 时 需要 一 个 共享 的 文件 ， 

若 用 户 太 多 ,共享 内 存 的 信号 量 解决 方案 就 无 法 报告 正确 的 结果 。 考 虑 一 下 这 
样 的 模式 : 读者 A 将 读者 计数 器 增 至 1。 接 下 来 ,读者 B 将 读者 计数 和 莫 增 至 2。 
这 时 ,读者 入 已 经 读数 据 完毕 ,将 读者 计数 吴 减 1, 但 读者 心 又 将 计数 器 增 1, 
因此 读者 计数 髓 这 个 时 候 仍 为 2。 之 后 ,读者 BARA 重 来 ,C 结束 ,然后 日 又 
Hee, AM IB AMT ie SER A TERE RE. 解释 -- 下 为 什么 这 种 情 
LBA ip T AAE EF). PEM EE. f A BT Bh Br af ao BUDE 2E S. P 
编号 -- 个 cp 命令 的 新 版 本 打印 机 程序 。 E EA S Scope 9 Br EXE S H PE I 
同步 访问 冲突 。 在 你 的 机 器 上 使 用 这 个 程序 同时 打印 两 个 文件 ; 


printcp filel /dev/lpl & printep file? /dev/lpl& 


